2024-09
社交召唤:多用户运行时协作与 AI 构建虚拟 3D 世界
分类: 人机交互, 人工智能, 计算和语言, 新兴技术
作者: Amina Kobenova, Cyan DeVeaux, Samyak Parajuli, Andrzej Banburski-Fahey, Judith Amores Fernandez, Jaron Lanier
发布时间: 2024-09-30
链接: http://arxiv.org/abs/2410.00274v2
摘要: 生成式人工智能在促进虚拟世界的存在方面表现出了希望,但很少有人关注理解这一过程如何作为社交互动展开。我们推出了 Social Conjurer,这是一个用于人工智能增强的动态 3D 场景共同创建的框架,多个用户可以实时协作构建和修改虚拟世界。通过一系列扩展的交互,包括社交和基于工具的参与以及空间推理,我们的框架有助于创建丰富、多样化的虚拟环境。初步用户研究 (N=12) 的结果提供了对这种方法的用户体验、社交背景如何塑造空间环境提示以及基于提示的 3D 共同创作的社交应用的见解的见解。除了强调 AI 支持的多用户世界创建的潜力并为 VR 中 AI 增强的创意流程提供新途径之外,本文还提出了设计以人为本的界面(将 AI 模型融入 3D 内容生成)的一系列启示。
具有软盘模式的可重新编程的材料内矩阵向量乘法
分类: 软凝聚态物质, 新兴技术
作者: Theophile Louvet, Parisa Omidvar, Marc Serra-Garcia
发布时间: 2024-09-30
链接: http://arxiv.org/abs/2409.20425v1
摘要: 矩阵向量乘法是人工智能的基本构建模块;这一重要作用促使它们在各种物理基板中得到应用,从忆阻器交叉阵列到光子集成电路。然而,它们在软物质智能系统中的实现仍然难以捉摸。在这里,我们通过实验演示了一种可重新编程的弹性超材料,它使用软盘模式计算矩阵向量乘法——存储弹性能接近于零的变形。软盘模式使我们能够对复杂的变形进行编程,而不会受到材料自然刚度的阻碍;但它们的实际应用具有挑战性,因为它们的存在取决于系统的全局拓扑特性。为了克服这一挑战,我们引入了具有明确兼容性特征的连续参数化单元设计。然后将该单位单元组合起来形成任意矩阵向量乘法,甚至可以在制造后重新编程。我们的结果表明,软盘模式可以成为体现智能、智能 MEMS 设备和传感器内边缘计算的关键推动者。
非理想意识训练使忆阻网络对对抗性攻击更加鲁棒
分类: 新兴技术, 密码学和安全, 机器学习
作者: Dovydas Joksas, Luis Muñoz-González, Emil Lupu, Adnan Mehonic
发布时间: 2024-09-29
链接: http://arxiv.org/abs/2409.19671v1
摘要: 神经网络现在已广泛应用于从对象分类到自然语言系统的各个领域。使用忆阻器等模拟设备的实现有望实现更高的功效,从而有可能将这些应用带到更多的环境中。然而,此类系统遭受更频繁的设备故障,总体而言,它们遭受对抗性攻击的情况尚未得到广泛研究。在这项工作中,我们研究了非理想意识训练(一种处理物理非理想性的常用技术)如何影响对抗鲁棒性。我们发现,即使对测试期间会遇到什么非理想情况了解有限,对抗性的鲁棒性也得到了显着提高。
用于快速且节能的大型语言模型的模拟内存计算注意力机制
分类: 神经和进化计算, 人工智能, 硬件架构, 新兴技术
作者: Nathan Leroux, Paul-Philipp Manea, Chirag Sudarshan, Jan Finkbeiner, Sebastian Siegel, John Paul Strachan, Emre Neftci
发布时间: 2024-09-28
链接: http://arxiv.org/abs/2409.19315v1
摘要: 由自注意力机制驱动的 Transformer 神经网络是基础语言模型和大型语言模型的核心组件。在生成变压器中,自注意力使用缓存来存储令牌投影,避免在每个时间步重新计算。然而,对于每个新的生成步骤,GPU 存储的投影必须加载到 SRAM 中,从而导致长序列出现延迟和能量瓶颈。在这项工作中,我们提出了一种使用基于增益单元存储器的模拟内存计算的快速且节能的自注意力硬件实现。可以有效地写入易失性增益单元存储器以在序列生成期间存储新标记,同时执行模拟带符号权重乘法以计算自注意力所需的点积。我们实现了滑动窗口注意,它保留了一组有限的过去步骤的记忆。用于阵列读出的电荷脉冲转换器消除了自关注级之间的模数转换的需要。使用共同设计的初始化算法来调整预训练权重以获得单元非理想性,尽管存在硬件限制,但我们以最少的训练迭代实现了与 ChatGPT-2 相当的 NLP 性能。我们的端到端硬件设计包括数字控制、估计面积、延迟和能量。与 GPU 相比,该系统将注意力延迟降低了两个数量级,能耗降低了五个数量级,标志着大型语言模型中超快速、低功耗序列生成的重要一步。
基于反馈的混合现实和机器人制造的手势识别:UnLog 塔案例研究
分类: 人机交互, 新兴技术, 机器人技术
作者: Alexander Htet Kyaw, Lawson Spencer, Sasa Zivkovic, Leslie Lok
发布时间: 2024-09-28
链接: http://arxiv.org/abs/2409.19281v1
摘要: 混合现实 (MR) 平台使用户能够在高度定制和参数化建筑结构的组装和制造过程中与三维全息指令进行交互,而无需二维绘图。以前的 MR 制造项目主要依赖数字菜单和自定义按钮作为用户与 MR 环境交互的界面。尽管这种方法被广泛采用,但它允许人类与物理对象直接交互以修改 MR 环境中的制造指令的能力有限。这项研究通过实时手势识别将用户与物理对象的交互集成为输入,以修改、更新或生成新的数字信息,从而实现物理和虚拟环境之间的相互刺激。因此,数字环境生成用户提供的与物理对象的交互,以允许制造过程中的无缝反馈。这项研究研究了基于反馈的 MR 工作流程的手势识别,用于 UnLog 塔施工过程中的机器人制造、人体组装和质量控制。
下一代无线局域网基于共享的信道接入过程
分类: 网络和互联网架构, 新兴技术, 信息论, 信息论
作者: Qing Xia, Salvatore Talarico
发布时间: 2024-09-28
链接: http://arxiv.org/abs/2409.19219v1
摘要: 本文提出了一种新的信道接入过程,通过允许属于同一网络的设备之间的合作来减轻下一代无线局域网(WLAN)中的信道接入争用,同时在每个设备如何竞争介质方面保持高度灵活性。在介绍了所提议的过程(此处称为基于共享的协议)的详细信息后,进行了分析,以将其与 IEEE 802.11 标准中当前采用的两种最先进的协议(即增强型分布式信道接入)进行比较。基于 (EDCA) 和基于触发的协议。在这方面,导出了封闭式表达式来评估每个协议的信道访问的成功概率。为了展示所提议程序的优点,还提供了全面的系统级分析,其中强调所提议的程序在减轻端到端(E2E)延迟和通过减少系统的整体拥塞来实现更好的频谱利用率。
开放生态系统中负责任的人工智能:协调创新与风险评估和披露
分类: 人机交互, 人工智能, 计算机与社会, 新兴技术, 软件工程
作者: Mahasweta Chakraborti, Bert Joseph Prestoza, Nicholas Vincent, Seth Frey
发布时间: 2024-09-27
链接: http://arxiv.org/abs/2409.19104v1
摘要: 人工智能的快速扩展促使人们越来越重视开发和实践中的道德考虑。这导致制定了日益复杂的模型审计和报告要求以及治理框架,以减轻个人和社会的潜在风险。在此关键时刻,我们回顾了在 OSS 等支持重要基础设施并得到广泛使用的非正式部门中促进负责任的人工智能和透明度所面临的实际挑战。我们重点关注模型性能评估如何告知或抑制对模型局限性、偏差和其他风险的探索。我们对 7903 Hugging Face 项目的受控分析发现,风险记录与评估实践密切相关。然而,来自该平台最受欢迎的竞争排行榜的提交内容(N=789)显示,高绩效者的责任感较低。我们的研究结果可以为人工智能提供商和法律学者设计干预措施和政策提供信息,以保护开源创新,同时激励道德的采用。
模拟快速傅里叶变换可实现可扩展且高效的信号处理
分类: 新兴技术, 信号处理
作者: T. Patrick Xiao, Ben Feinberg, David K. Richardson, Matthew Cannon, Harsha Medu, Vineet Agrawal, Matthew J. Marinella, Sapan Agarwal, Christopher H. Bennett
发布时间: 2024-09-27
链接: http://arxiv.org/abs/2409.19071v1
摘要: 边缘设备的部署量不断增加,以感知来自物理世界的信息并采取行动。通常需要离散傅里叶变换 (DFT) 来使这些感测数据适合进一步处理 $\unicode{x2013}$,例如通过人工智能 (AI) 算法 $\unicode{x2013}$ 以及通过通信网络进行传输。模拟内存计算已被证明是一种快速且节能的解决方案,可用于处理边缘人工智能工作负载,但不适用于傅里叶变换。这是因为快速傅立叶变换 (FFT) 算法的存在,该算法极大地降低了 DFT 的复杂性,但迄今为止仅属于数字处理器。在这里,我们展示了 FFT 可以映射到模拟内存计算系统,使它们能够有效地扩展到任意大的傅里叶变换,而不需要大尺寸或大量的非易失性存储器阵列。我们使用具有精确可调、低电导模拟状态的大规模电荷捕获存储器阵列,通过实验演示了 1D 音频和 2D 图像信号上的模拟 FFT。利用新的模拟 FFT 方法和电荷捕获存储器件的可扩展性来计算 65,536 点的模拟 DFT,这是模拟系统无法达到的规模,并且比以前的任何方法都大 $>$1000$\times$模拟 DFT 演示。与直接矩阵向量乘法方法相比,模拟 FFT 还提供了数值更精确的 DFT,对器件和电路非理想性具有更大的容忍度。我们表明,将 FFT 算法扩展到模拟内存处理器会导致与数字实现明显不同的设计考虑,并且模拟傅里叶变换在所有规模上都比在现有技术上实现的 FFT 具有显着的功效优势。 -艺术数字硬件。
网络入侵检测系统中的对抗性挑战:研究见解和未来展望
分类: 密码学和安全, 新兴技术, 网络和互联网架构
作者: Sabrine Ennaji, Fabio De Gaspari, Dorjan Hitaj, Alicia K/Bidi, Luigi V. Mancini
发布时间: 2024-09-27
链接: http://arxiv.org/abs/2409.18736v1
摘要: 机器学习为网络安全带来了重大进步,特别是在入侵检测系统领域。这种改进主要归因于机器学习算法能够识别数据中特征之间的复杂关系并很好地推广到未见过的样本。深度神经网络通过分析大量训练数据,显着提高检测性能,对这一进步做出了特别贡献。然而,机器学习模型很容易受到对抗性攻击:对输入数据的操纵旨在误导模型做出错误的预测。尽管人们对文本和图像等非结构化数据中的对抗性威胁给予了很多关注,但它们在网络流量等结构化数据中的有效性尚未得到充分探讨。本调查旨在通过对基于机器学习的网络入侵检测系统 (NIDS) 进行严格审查并对其对抗性攻击的脆弱性进行全面分析来填补这一空白。我们严格审查现有的 NIDS 研究,强调主要趋势、优势和局限性,并找出需要进一步探索的理解差距。我们进一步讨论新出现的挑战,并为开发更强大、更有弹性的 NIDS 模型提供见解。总之,本文旨在增强对 NIDS 中对抗性攻击和防御的理解,并指导未来提高网络安全应用中机器学习模型的鲁棒性的研究。
通过分子通信纳米网络中的本地化中继增强药物输送
分类: 新兴技术
作者: Ethungshan Shitiri, Akarsh Yadav, Sergi Abadal, Eduard Alarcón, Ho-Shin Cho
发布时间: 2024-09-27
链接: http://arxiv.org/abs/2409.18616v1
摘要: 体内纳米网络有望通过分子通信 (MC) 推进靶向药物输送 (TDD) 系统。在基线 MC-TDD 系统中,载药纳米机器 (DgN) 位于受感染组织附近,直接输送药物分子。为了减轻扩散引起的药物输送效率下降,我们提出了一种带有中继网络的增强型 MC-TDD 系统。该网络采用了一种新颖的本地化中继机制,其中纳米控制器广播本地化信号。然后,DgN 根据阈值测量接收到的信号强度,以确定它们相对于受感染组织的簇。此外,我们的研究考虑了多个吸收 DgN 对通道脉冲响应 (CIR) 的影响,这是以前的工作中忽略的一个因素。与基线系统相比,我们的方法将药物输送效率提高了 17%$。重要的是,我们发现优化 CIR 对于提高药物输送效率至关重要。这些发现为进一步研究优化基于 CIR 的继电器选择以及研究药物分子寿命、阻塞概率和流动动力学等因素的影响铺平了道路。
通过海森堡不确定性原理扩展攻击向量,揭示量子系统中隐藏的漏洞
分类: 量子物理学, 新兴技术
作者: Jose R. Rosas-Bustos, Jesse Van Griensven The, Roydon Frayser
发布时间: 2024-09-27
链接: http://arxiv.org/abs/2409.18471v1
摘要: 这项研究发现了量子密钥分发 (QKD) 协议中的新漏洞,这些漏洞超出了传统的实现缺陷,例如漏洞。这些新发现的漏洞源于贝尔不等式 (BI) 和隐变量理论 (HVT) 之间复杂的相互作用,而海森堡不确定性原理 (HUP) 进一步加剧了这种相互作用。通过理论分析、模拟和量子实验的结合,我们揭示了挑战当今量子密码学核心假设的关键安全弱点。虽然这些漏洞与已知漏洞不同,但当与传统网络攻击一起考虑时,它们对 QKD 和量子完整性系统的稳健性构成了重大威胁。这些结果为重新思考当前的量子安全框架提供了新的视角,以确保未来量子密码和量子完整性协议的稳健性。
利用 ELAA 在非平稳通道上进行传感辅助近场能量束聚焦
分类: 信息论, 新兴技术, 信息论
作者: Li Zhang, Zixiang Ren, Yuan Fang, Ling Qiu, Jie Xu
发布时间: 2024-09-26
链接: http://arxiv.org/abs/2410.12579v1
摘要: 本文研究了一种用于具有超大规模天线阵列(ELAA)的近场无线电力传输(WPT)系统的新型免训练能量束聚焦方法。我们特别关注一个接入点 (AP) 的设置,该接入点配备了超大规模均匀平面阵列 (UPA),为多个单天线能量接收器 (ER) 提供服务,其中视距 (LoS)主导无线信道取决于 ER 的相对位置,并表现出空间非平稳性。与依赖训练和反馈的传统设计不同,我们提出了一种基于两级传输协议的无线雷达传感辅助的新型能量束聚焦设计。在第一阶段,AP 执行无线雷达感测,以识别 ER 的可见区域 (VR) 并估计其三维 (3D) 位置,以构建相应的信道状态信息 (CSI)。第二阶段,AP根据构建的CSI实现发射能量束聚焦,对这些ER进行高效充电。在这种设置下,我们首先最小化第一阶段的传感持续时间,同时保证位置估计的特定精度阈值。接下来,我们优化第二阶段 AP 处的能量波束形成器,以在最大发射功率约束下最大化所有 ER 中的加权收获能量。在这种方法中,两个阶段之间的时间资源分配经过适当设计,以优化最终的能量传输性能。数值结果表明,所提出的设计在完美的 VR 和 CSI 下的性能接近性能上限,并且显着优于其他基准方案。
下一代软件工程:人工智能辅助的大模型
分类: 软件工程, 新兴技术, D.2.0; K.6.3
作者: Ina K. Schieferdecker
发布时间: 2024-09-26
链接: http://arxiv.org/abs/2409.18048v1
摘要: 模型驱动软件工程(MDSE)的有效性已经在复杂软件的背景下得到了证明;然而,由于与模型开发和维护相关的必要工作以及 MDSE 所需的特定建模能力,它尚未被广泛采用。与此同时,人工智能(AI)方法,特别是机器学习(ML)方法,在应用于开源编码平台上可访问的庞大代码库时,已经表现出了相当大的能力。所谓的大代码为实证软件工程、编码过程自动化和利用人工智能提高软件质量的重大进步奠定了基础。本文的目的是促进软件工程(SE)这两个重要领域(即 SE 中的模型和人工智能)之间的综合。本文概述了人工智能辅助软件工程的现状。鉴于上述考虑,提出了人工智能辅助SE大模型的愿景,目的是在软件开发的背景下利用这两种方法固有的优势。最后,提出了MDSE中配对建模的新范式。
与生态系统无关的量子运行时架构标准化:加速量子计算的实用性
分类: 量子物理学, 新兴技术
作者: Markiian Tsymbalista, Ihor Katernyak
发布时间: 2024-09-26
链接: http://arxiv.org/abs/2409.18039v1
摘要: 容错性是一个长期目标,促使许多公司和研究组织竞相让当前不完善的量子计算机变得有用——量子实用(QU)。通过利用主要由人工智能技术驱动的软件优化方法来实现这一目标看起来很有希望。这项积极的研究涵盖了量子计算优化中间件 (QCOM) 的所有层,并且需要在真正的量子硬件 (QH) 上执行。由于技术领域的新生性质以及大型和小型参与者的专有策略,执行量子工作负载的流行运行时在编程模型、调度和硬件访问模式(包括排队)方面缺乏灵活性,这为研究人员造成了障碍并减慢了创新速度。新兴的混合操作模型进一步加剧了这些问题,这些模型将图形处理单元(GPU)超级计算和量子中间表示(QIR)置于跨量子和分布式资源的实时计算的核心。需要一个由开源社区驱动的广泛采用的运行时平台(RP),可以轻松部署以在量子处理单元(QPU)、GPU、控制硬件、外部计算资源之间以分布式方式工作,并提供所需的编程和配置模型方面的灵活性。
异构交通流中的模块化自动驾驶汽车:建模、仿真和应用
分类: 多代理系统, 新兴技术
作者: Lanhang Ye, Toshiyuki Yamamoto
发布时间: 2024-09-26
链接: http://arxiv.org/abs/2409.17945v1
摘要: 模块化自动驾驶汽车(MAV)代表了一个突破性的概念,它将模块化集成到自动驾驶汽车的持续开发中。这种创新设计为交通流引入了独特的功能,允许多个模块无缝连接在一起并集体运行。为了了解这些车辆及其集体运行的交通流特征,本研究建立了一个专门设计的建模框架来模拟它们在交通流中的行为。对包含各种模块尺寸的任意形成的列车的混合交通流进行建模和研究。在不同水平的交通需求和渗透率下进行模拟,以检查这些车辆及其运行情况下的交通流动态。分析了混合交通流的微观轨迹、MAV列车组成和宏观基本图。模拟结果表明,集成微型飞行器及其集体运行可以显着提高运力,提高的程度取决于混合交通流的渗透率。值得注意的是,当渗透率超过 75% 时,容量几乎翻倍。此外,它们的存在显着影响和调节混合交通的自由流动速度。特别是,当 MAV 和背景交通之间存在运行速度限制变化时,混合交通会根据这些车辆的运行速度进行调整。这项研究提供了对结合新兴 MAV 技术的未来潜在交通流系统的见解。
PhantomLiDAR:针对 LiDAR 的跨模态信号注入攻击
分类: 信号处理, 人工智能, 新兴技术, 系统与控制, 系统与控制
作者: Zizhi Jin, Qinhong Jiang, Xuancun Lu, Chen Yan, Xiaoyu Ji, Wenyuan Xu
发布时间: 2024-09-26
链接: http://arxiv.org/abs/2409.17907v1
摘要: LiDAR(光检测和测距)是自动驾驶的关键传感器,可提供精确的 3D 空间信息。以往针对激光雷达系统的信号攻击主要利用激光信号。在本文中,我们研究了跨模态信号注入攻击的可能性,即注入故意电磁干扰(IEMI)来操纵激光雷达输出。我们的见解是,激光雷达的内部模块,即激光接收电路、监控传感器和光束控制模块,即使经过严格的电磁兼容性(EMC)测试,仍然可以与 IEMI 攻击信号耦合并导致LiDAR 系统的故障。基于上述攻击面,我们提出了 PhantomLiDAR 攻击,该攻击通过点干扰、点注入、点移除甚至 LiDAR 关机等方式操纵 LiDAR 输出。我们通过在五个 COTS LiDAR 系统上进行的模拟和真实实验来评估和证明 PhantomLiDAR 的有效性。我们还在现实世界的移动场景中进行可行性实验。我们提供可在传感器级别和车辆系统级别实施的潜在防御措施,以减轻与 IEMI 攻击相关的风险。视频演示可以在 https://sites.google.com/view/phantomlidar 上观看。
用于硬件加速器的基于 5T-2MTJ STT 辅助自旋轨道扭矩的三态内容可寻址存储器
分类: 新兴技术, 硬件架构
作者: Siri Narla, Piyush Kumar, Azad Naeemi
发布时间: 2024-09-26
链接: http://arxiv.org/abs/2409.17863v1
摘要: 在这项工作中,我们提出了一种新型非易失性自旋转移矩(STT)辅助自旋轨道矩(SOT)的基于三态内容可寻址存储器(TCAM),具有5个晶体管和2个磁隧道结(MTJ)。我们对所提出的设计从设备级到应用程序级进行了全面的研究。在器件层面,利用微磁模拟获得了各种写入特性,例如写入错误率、时间和电流。阵列级搜索和写入性能基于 SPICE 电路仿真进行了评估,其中提取了位单元的布局寄生效应,同时还考虑了 7nm 技术节点互连寄生效应的影响。考虑到设计中的各种变化源,预计精确搜索的搜索错误率为 3.9x10^-11。此外,在各种场景下对搜索操作的分辨率进行量化,以了解近似搜索操作可实现的质量。所提出的设计的应用程序级性能和准确性已在基于 CAM 的推荐系统的背景下与其他最先进的 CAM 设计进行了评估和基准测试。
VVTEAM:易失性忆阻器的紧凑行为模型
分类: 硬件架构, 新兴技术, 神经和进化计算
作者: Tanay Patni, Rishona Daniels, Shahar Kvatinsky
发布时间: 2024-09-26
链接: http://arxiv.org/abs/2409.17723v1
摘要: 易失性忆阻器最近作为一种有前途的神经形态电路器件而受到欢迎,它能够模仿神经元的泄漏功能,并在功耗和面积方面比基于电容器的电路具有优势。此外,易失性忆阻器可用作选择器设备和硬件安全电路,例如物理不可克隆功能。为了促进电路的设计和仿真,紧凑的行为模型至关重要。本文提出了 V-VTEAM,这是一种紧凑、简单、通用且灵活的易失性忆阻器行为模型,受到 VTEAM 非易失性忆阻器模型的启发,并在 MATLAB 中开发。通过将模型拟合到基于离子漂移/扩散的 Ag/SiOx/C/W 挥发性忆阻器,证明了该模型的有效性,实现了 4.5% 的相对均方根误差。
DEMO 增强型 BPMN
分类: 软件工程, 新兴技术, H.1.1, H.4.3, D.2.1
作者: Sérgio Guerreiro, Jan Dietz
发布时间: 2024-09-25
链接: http://arxiv.org/abs/2410.08215v1
摘要: 本文介绍了 DEMO(组织设计和工程方法)和 BPMN(业务流程模型和表示法)之间的集成。虽然 BPMN 因其直观的、基于流的业务流程表示而被广泛使用,但它在多方协作建模方面缺乏正式语义、模糊性和局限性。相比之下,DEMO 提供了一个理论上稳健的、本体驱动的框架,专注于抽象业务流程的基本结构。提出并演示了一种新颖的方法,将 DEMO 事务模式的严格性与更实用、广泛采用的 BPMN 框架相结合。这种集成允许在 BPMN 图中利用 DEMO 理论基础的优势,从而提供对业务流程更全面、更精确的理解。我们认为这种组合丰富了业务流程的建模,为从业者和研究人员提供了更加一致和可靠的工具。
基于混合量子经典人工智能的检测策略,用于针对自动驾驶车辆交通标志分类系统的基于生成对抗网络的 Deepfake 攻击
分类: 人工智能, 新兴技术
作者: M Sabbir Salek, Shaozhi Li, Mashrur Chowdhury
发布时间: 2024-09-25
链接: http://arxiv.org/abs/2409.17311v1
摘要: 自动驾驶汽车 (AV) 中的感知模块在很大程度上依赖于基于深度学习的模型来检测和识别周围环境中的各种物体。 AV 交通标志分类系统是该模块的一部分,可帮助 AV 识别道路交通标志。然而,在对抗性攻击中,攻击者修改或更改为交通标志识别而捕获的图像,可能会导致自动驾驶汽车错误识别交通标志并造成危险后果。 Deepfake 是一种很有前途的技术,可用于此类对抗性攻击,其中 Deepfake 交通标志将取代现实世界的交通标志图像,然后将图像输入 AV 交通标志分类系统。在这项研究中,作者介绍了如何设计基于生成对抗网络的 Deepfake 攻击来欺骗 AV 交通标志分类系统。作者利用混合量子经典神经网络(NN)开发了一种深度伪造交通标志图像检测策略。这种混合方法利用幅度编码来表示使用量子态的输入交通标志图像的特征,与经典方法相比,这大大减少了内存需求。作者在现实世界和深度伪造的交通标志图像上评估了这种混合深度伪造检测方法以及几个基线经典卷积神经网络。结果表明,在大多数情况下,用于深度伪造检测的混合量子经典神经网络可以实现与基线经典卷积神经网络相似或更高的性能,同时所需的内存不到本研究中考虑的最浅经典卷积神经网络所需的三分之一。
Omni 3D:兼容 BEOL 的 3D 逻辑,具有无所不在的电源、信号和时钟
分类: 新兴技术, 硬件架构
作者: Suhyeong Choi, Carlo Gilardi, Paul Gutwin, Robert M. Radway, Tathagata Srimani, Subhasish Mitra
发布时间: 2024-09-25
链接: http://arxiv.org/abs/2409.16608v1
摘要: 本文介绍了 Omni 3D——一种由后端 (BEOL) 兼容晶体管自然支持的 3D 堆叠设备架构。 Omni 3D 将信号/电源的金属层与 3D 中的 FET 任意交错(即 nFET 和 pFET 以 3D 方式堆叠)。因此,信号/电源布线层可以对 FET 有源区域进行细粒度、全方位的访问,从而最大限度地提高 3D 标准单元设计的灵活性。这与背面供电网络 (BSPDN)、互补 FET (CFET) 和堆叠 FET 等方法形成鲜明对比。重要的是,Omni 3D 的布线灵活性是通过双面布线和分别用于单元间和单元内布线的交错金属 (IM) 层实现的。在这项工作中,我们探索 Omni 3D 变体(例如,带或不带 IM 层)并使用虚拟源 BEOL-FET 紧凑模型优化这些变体。我们建立了一个物理设计流程,可有效利用 Omni 3D 中的双面布线,并在多个设计点上对 Omni 3D 设备架构进行彻底的设计技术协同优化 (DTCO)。根据我们的设计流程,与采用 BSPDN 的最先进 CFET 相比,我们预计能量延迟乘积将提高 2.0 倍,面积将减少 1.5 倍。
生成式人工智能在电动汽车互联网中的作用
分类: 机器学习, 人工智能, 新兴技术
作者: Hanwen Zhang, Dusit Niyato, Wei Zhang, Changyuan Zhao, Hongyang Du, Abbas Jamalipour, Sumei Sun, Yiyang Pei
发布时间: 2024-09-24
链接: http://arxiv.org/abs/2409.15750v1
摘要: 随着生成人工智能(GenAI)模型的进步,其生成内容的能力显着增强,从而在数据生成和预测领域得到广泛应用。此外,GenAI拥有强大的数据建模和分析能力,从多方面增强了电动汽车互联网(IoEV)的应用。在本文中,我们调查和调查了 GenAI 在 IoEV 中的应用。具体来说,我们将 IoEV 的 GenAI 分为四个不同的层,即电动汽车的电池层、个体电动汽车(EV)层、带电动汽车的智能电网层和安全层。我们首先介绍车联网应用各层中使用的各种 GenAI 技术。随后,总结了可用于训练 GenAI 模型的公共数据集。最后,我们为未来的方向提供建议。这项调查不仅对 GenAI 在车联网中不同层的应用进行了分类,而且通过强调每一层内的设计和实施挑战,为研究人员和从业者提供了宝贵的资源。此外,它还为未来的研究方向提供了路线图,通过集成先进的 GenAI 技术来开发更强大、更高效的 IoEV 系统。
MACeIP:智慧城市中的多模式环境丰富智能平台
分类: 人工智能, 新兴技术, 人机交互
作者: Truong Thanh Hung Nguyen, Phuc Truong Loc Nguyen, Monica Wachowicz, Hung Cao
发布时间: 2024-09-23
链接: http://arxiv.org/abs/2409.15243v1
摘要: 本文提出了一个用于智慧城市的多模式环境丰富智能平台(MACeIP),这是一个旨在增强城市管理和公民参与的综合系统。我们的平台集成了先进技术,包括物联网(IoT)传感器、边缘计算和云计算以及多模态人工智能,以创建响应灵敏的智能城市生态系统。主要组件包括用于公民互动的互动中心、广泛的物联网传感器网络、智能公共资产管理、行人监控系统、城市规划门户和云计算系统。我们在几个城市展示了 MACeIP 的原型,重点是新不伦瑞克省的弗雷德里克顿。这项工作通过提供可扩展、高效且以用户为中心的城市智能和管理方法,为创新城市发展做出贡献。
从张量序列角度进行异常检测
分类: 机器学习, 密码学和安全, 新兴技术, 信息论, 信息论, 量子物理学, 94A15, 81P68, G.1.3; H.3.3; K.6.5
作者: Alejandro Mata Ali, Aitor Moreno Fdez. de Leceta, Jorge López Rubio
发布时间: 2024-09-23
链接: http://arxiv.org/abs/2409.15030v1
摘要: 我们通过在张量序列表示中使用数据压缩,在张量网络中提出了一系列用于数据集中异常检测的算法。这些算法包括在压缩中保留正常数据的结构和删除异常数据的结构。该算法可以应用于任何张量网络表示。我们使用数字和好利获得人脸数据集以及网络安全数据集来测试这些方法的有效性,以确定网络攻击。
Loihi 2 上用于高效流序列处理的对角结构化状态空间模型
分类: 机器学习, 人工智能, 新兴技术, 神经和进化计算
作者: Svea Marie Meyer, Philipp Weidel, Philipp Plank, Leobardo Campos-Macias, Sumit Bam Shrestha, Philipp Stratmann, Mathis Richter
发布时间: 2024-09-23
链接: http://arxiv.org/abs/2409.15022v1
摘要: 深度状态空间模型 (SSM) 在远程序列建模任务上展示了最先进的性能。虽然 SSM 的循环结构可以在训练期间有效地实现为卷积或并行扫描,但循环逐个令牌处理目前无法在 GPU 上有效实现。在这里,我们展示了 SSM S4D 在英特尔最先进的 Loihi 2 神经拟态处理器上的高效逐个令牌推理。我们将 sMNIST、psMNIST 和 sCIFAR 上 SSM 的首次神经形态硬件实现与 Jetson Orin Nano (Jetson) 上 S4D 的循环和卷积实现进行比较。虽然我们发现 Jetson 在基于离线逐个样本的批处理模式中表现更好,但 Loihi 2 在基于逐个令牌的处理模式中表现更好,它消耗的能源减少了 1000 倍,延迟降低了 75 倍,延迟提高了 75 倍与 Jetson 上 S4D 的循环实现相比的吞吐量。这为 SSM 的高效实时流应用开辟了新途径。
用于决策支持系统的可解释且以人为本的人工智能:认知准伙伴关系理论
分类: 人工智能, 新兴技术, 人机交互, K.4.1; H.5.2; H.4.2; J.7; J.4
作者: John Dorsch, Maximilian Moll
发布时间: 2024-09-23
链接: http://arxiv.org/abs/2409.14839v1
摘要: 在人工智能决策支持系统(AI-DSS)的背景下,我们认为满足道德和可解释人工智能(XAI)的要求就是开发AI-DSS,为人类决策者提供三种基于人性化的解释: 、反事实和置信度,我们将这种方法称为 RCC 方法。我们首先回顾当前的实证 XAI 文献,这些文献研究了生成模型解释的各种方法(例如 LIME、SHAP、Anchors)、模型的感知可信度和最终用户准确性之间的关系。我们展示了当前关于什么是良好的人性理由的理论要么无法充分解释这一证据,要么无法为发展提供合理的道德建议。因此,我们提出了一种新颖的人机交互理论:认知准伙伴关系理论(EQP)。最后,我们激励采用 EQP 并演示它如何解释经验证据、提供合理的道德建议以及如何采用 RCC 方法。
AmpAgent:基于 LLM 的多智能体系统,用于从工艺和性能移植文献中进行多级放大器原理图设计
分类: 新兴技术, 系统与控制, 系统与控制
作者: Chengjie Liu, Weiyu Chen, Anlan Peng, Yuan Du, Li Du, Jun Yang
发布时间: 2024-09-23
链接: http://arxiv.org/abs/2409.14739v1
摘要: 多级放大器广泛应用于模拟电路中。然而,它们的大量组件、复杂的传递函数和复杂的零极点分布需要大量的人力进行推导和参数调整,以确保其稳定性。为了实现传递函数的高效推导并简化电路设计的难度,我们提出了AmpAgent:一种基于大语言模型(LLM)的多智能体系统,用于通过工艺和性能移植从文献中有效地设计此类复杂的放大器。 AmpAgent 由三个代理组成:文献分析代理、数学推理代理和设备规模调整代理。他们分别负责从文献中检索关键信息(例如公式和传递函数),通过推导关键公式来分解整个电路的设计问题,并迭代解决分解后的问题。 AmpAgent 用于七种不同补偿技术的多级放大器的原理图设计。在设计效率方面,AmpAgent较传统优化算法减少了迭代次数1.32$ \sim $4${\times}$,执行时间减少1.19$ \sim $2.99${\times}$,成功率增加了 1.03$ \sim $6.79${\times}$。电路性能方面,较原文献提高了1.63$ \sim $27.25${\times}$。研究结果表明,大语言模型可以在复杂模拟电路原理图设计以及工艺和性能移植领域发挥至关重要的作用。
支持语义通信的 6G-NTN 框架:一种新颖的去噪和网关跳跃集成机制
分类: 新兴技术, 信号处理
作者: Loc X. Nguyen, Sheikh Salman Hassan, Yan Kyaw Tun, Kitae Kim, Zhu Han, Choong Seon Hong
发布时间: 2024-09-23
链接: http://arxiv.org/abs/2409.14726v1
摘要: 第六代 (6G) 非地面网络 (NTN) 对于救灾等关键应用的实时监控至关重要。然而,有限的带宽、延迟、雨衰、长传播延迟和同信道干扰给高效卫星通信带来了挑战。因此,语义通信(SC)已成为提高传输效率和解决这些问题的有前途的解决方案。在本文中,我们探讨了 SC 作为一种特别适合 6G 卫星通信的带宽高效、延迟最小化策略的潜力。虽然现有的 SC 方法已在直接卫星地面传输中证明了有效性,但由于网关跳跃中继之间的失真累积,它们在卫星网络中遇到了限制。此外,某些地面用户 (GU) 的信噪比 (SNR) 较差,这使得直接卫星通信具有挑战性。为了解决这些问题,我们提出了一种新颖的框架,该框架可以优化低 SNR GU 的网关跳中继选择,并集成基于网关的去噪机制,以确保基于卫星的 SC 网络中的高质量服务 (QoS)。这种方法直接减轻失真,通过提供针对每个 GU 独特信号条件的定制服务,显着提高卫星服务性能。我们的研究结果代表了地球观测卫星可靠、高效的数据传输方面的重大进步,从而能够快速有效地应对紧急事件。仿真结果表明,我们提出的策略显着提高了整体网络性能,通过根据特定的 GU 条件提供定制的通信服务,优于传统方法。
通过 PPRM 变换对 NEQR 量子电路进行门优化
分类: 量子物理学, 新兴技术
作者: Shahab Iranmanesh, Hossein Aghababa, Kazim Fouladi
发布时间: 2024-09-22
链接: http://arxiv.org/abs/2409.14629v1
摘要: 量子图像表示(QIR)是量子图像处理(QIP)中的一个关键挑战,因为图像中存在大量像素,这增加了对量子门和量子位的需求。然而,当前的量子系统面临运行时复杂性和可用量子位的限制。这项工作旨在通过将新型增强量子表示 (NEQR) 方案的异或和 (ESOP) 表达式转换为正极性里德穆勒 (PPRM) 等价形式来压缩量子电路,而不添加辅助量子位。对于具有 m 个控制量子位 ($m \rightarrow \infty$) 的 NEQR 电路,考虑运行时复杂度的两种情况:指数和线性,具体取决于多控制非门的分解。使用非线性回归,估计所提出的变换可将指数复杂度从 $O(2^m)$ 降低到 $O(1.5^m)$,压缩率接近 100%。对于线性复杂度,预计该转换会将运行时间减半,压缩率接近 52%。对六张 256$\times$256 图像的测试显示,指数情况下平均减少 105.5 倍,线性情况下平均减少 2.4 倍,平均压缩率分别为 99.05% 和 58.91%。
汽车应用的量子计算:从算法到应用
分类: 量子物理学, 新兴技术
作者: BMW Group Quantum Team, Johannes Klepsch, Jernej Rudi Finžgar, Florian Kiwit, Leonhard Hölscher, Marvin Erdmann, Lukas Müller, Chandan Kumar, Andre Luckow
发布时间: 2024-09-21
链接: http://arxiv.org/abs/2409.14183v1
摘要: 量子计算可能会影响各个行业,其中汽车行业面临着许多计算挑战,从优化供应链和制造到车辆工程,前景尤其光明。本章研究最先进的量子算法,以提高整个汽车价值链的效率、准确性和可扩展性。我们探索量子优化、机器学习以及数值和化学模拟方面的最新进展,强调它们的潜力和局限性。我们确定并讨论近期和容错算法的关键挑战及其在工业应用中的实际应用。虽然量子算法在许多应用领域显示出潜力,但当前嘈杂的中规模量子硬件限制了规模,从而限制了商业利益。从长远来看,容错系统有望在理论上实现加速;然而,它们还需要在硬件和软件方面取得进一步的进展(例如,与纠错和数据加载相关)。我们预计,随着这一进展,最终将带来显着的实际效益。
拦截无人机车辆路径问题的进化算法
分类: 人工智能, 计算机与社会, 新兴技术, 优化与控制
作者: Carlos Pambo, Jacomine Grobler
发布时间: 2024-09-21
链接: http://arxiv.org/abs/2409.14173v1
摘要: 使用卡车和无人机作为解决最后一英里交付挑战的解决方案是本文探讨的一个新的、有前途的研究方向。无人机在移动中或在客户位置时拦截卡车的问题的变化是优化问题的一部分,称为拦截无人机车辆路径问题 (VRPDi)。本文提出了一种求解VRPDi的进化算法。在 VRPDi 的这种变体中,需要安排多对卡车和无人机。两人一起或单独离开并返回仓库位置,以向客户节点送货。无人机可以在送货后拦截卡车或在以下客户地点与卡车会合。 Bouman 等人在无人机旅行推销员问题 (TSPD) 数据集上执行了该算法。 (2015),并通过将 VRPDi 的结果与同一数据集的 VRP 结果进行基准比较来比较算法的性能。此比较显示总交付时间缩短了 39% 至 60%。对算法结果的进一步详细分析检查了算法执行过程中的总传递时间、距离、节点传递调度和多样性程度。此分析还考虑了算法如何处理 VRPDi 约束。然后将该算法的结果与 Dillon 等人的算法进行基准测试。 (2023)和恩斯特(2024)。后者通过在 VRPDi 中添加最大无人机距离约束来解决该问题。算法结果的分析和基准测试表明,该算法在合理的时间内令人满意地解决了 50 和 100 节点的问题,并且找到的解决方案优于 Dillon 等人的算法找到的解决方案。 (2023) 和 Ernst (2024) 对于同样的问题。
Proxion:揭示隐藏代理智能合约以查找以太坊中的冲突漏洞
分类: 密码学和安全, 新兴技术, 软件工程
作者: Cheng-Kang Chen, Wen-Yi Chu, Muoi Tran, Laurent Vanbever, Hsu-Chun Hsiao
发布时间: 2024-09-20
链接: http://arxiv.org/abs/2409.13563v1
摘要: 代理设计模式允许以太坊智能合约同时不可变和可升级,其中原始合约被分为包含数据存储的代理合约和包含实现逻辑的逻辑合约。该架构已知存在安全问题,即代理和逻辑合约之间的功能冲突和存储冲突,并已在现实世界的事件中被利用来窃取用户价值数百万美元的数字资产。为了回应这种担忧,之前的几项工作试图识别以太坊中的代理合约并检测它们的冲突。然而,由于覆盖范围有限,它们都存在不足,通常将分析仅限于具有可用源代码或过去交易的合约。为了弥补这一差距,我们推出了 Proxion,这是一种自动跨合约分析器,可以识别以太坊中的所有代理智能合约及其冲突。 Proxion 的与众不同之处在于它能够分析缺乏源代码和过去交易的隐藏智能合约。 Proxion 配备了各种提高效率和准确性的技术,其性能优于最先进的工具,特别是识别了数百万个代理合约和数千个未报告的冲突。我们使用 Proxion 分析了 2015 年至 2023 年超过 3600 万份活跃合约,发现其中 54.2% 是代理合约,大约 150 万份合约存在至少一个冲突问题。
保护非洲的未来:坦桑尼亚儿童安全、学习和技能获取的网络安全战略
分类: 计算机与社会, 新兴技术
作者: Ezekia Gilliard, Abdul Maziko, Gideon Rwechungura, Ahmed Abubakar Aliyu, Erasto Kayumbe
发布时间: 2024-09-20
链接: http://arxiv.org/abs/2409.13159v1
摘要: 如今,非洲各地的儿童面临着越来越大的互联网风险。危险包括有害内容、暴力、剥削、虐待和忽视。由于移动和互联网技术使用的增加,所有这些都增加了,这不仅使他们的安全面临风险,而且影响了他们学习未来基本技能的能力。本文概述了第三世界非洲国家在确保儿童的网络安全并支持其发展需求方面所面临的独特挑战。它强调了其他国家为保护儿童免受网络威胁并提高他们的数字素养而采取的有效做法和政策。我们致力于分享其他国家用来保护儿童免受虐待并帮助他们在数字世界取得成功的最佳实践和政策。该研究强调了针对坦桑尼亚联合共和国的在线安全战略、法律框架和建议,以及与联合国儿童基金会和联合国等组织开展国际合作的重要性。其目标是为非洲政策制定者、教育工作者和网络安全专业人士提供实用的指导和建议,以加强非洲大陆内外的儿童上网安全举措。
通过机载机动双基地 ISAC 系统实现自适应跟踪和通信
分类: 信号处理, 新兴技术, 信息论, 网络和互联网架构, 信息论
作者: Mingliang Wei, Ruoguang Li, Li Wang, Lianming Xu, Zhu Han
发布时间: 2024-09-18
链接: http://arxiv.org/abs/2410.02796v1
摘要: 在这封信中,我们提出了一种机载可操纵双基地集成传感和通信系统,其中发射器和接收器都是无人机。通过根据目标的运动信息及时形成动态双基地测距,该系统可以提供自适应二维跟踪和通信服务。为此,制定了发射和接收无人机的轨迹优化问题,以通过最小化时变 Cramer Rao 界限来实现高精度运动状态估计,并满足足够的通信信噪比以维持通信信道预测错误。然后我们开发了一种基于逐次凸逼近技术和 S 过程的有效方法来解决该问题。数值结果表明,与静态或半动态ISAC系统相比,我们提出的机载机动双基地ISAC系统能够获得更高的跟踪精度。
QAMNet:快速高效的光学 QAM 神经网络
分类: 新兴技术
作者: Marc Gong Bacvanski, Sri Krishna Vadlamani, Kfir Sulimany, Dirk Robert Englund
发布时间: 2024-09-18
链接: http://arxiv.org/abs/2409.12305v2
摘要: 随着深度神经网络的不断成功和采用,神经网络推理的能耗已成为一个最重要的话题。模拟光学神经网络(ONN)可以将神经网络推理中矩阵向量乘法的能量降低到低于数字电子学的能量。然而,由于数模转换,实现这一承诺仍然具有挑战性:即使在低位精度 $b$ 下,将 $2^b$ 级别的数字权重和输入编码到模拟域也需要专门且耗电的电子设备。面对类似的挑战,电信领域开发了复值正交幅度调制 (QAM),这是数十年来的主力调制格式。 QAM 最大程度地利用复振幅,与仅强度调制相比,提供二次 $O(N^2) \to O(N)$ 节能。受这一优势的启发,这项工作引入了 QAMNet,这是一种光学神经网络硬件和架构,其能耗优于现有 ONN,充分利用了 QAM 光振幅的复杂性质。当使用传统电信设备实现时,我们表明 QAMNet 基于基于物理的模拟,可以加速复值深度神经网络,其精度与数字硬件无法区分。与标准 ONN 相比,我们发现 QAMNet ONN:(1) 在总位精度中等水平之上获得更高的精度,(2) 在低能量预算之上更准确,(3) 当硬件位精度有限时是最佳选择。
MedCodER:医疗编码的生成式人工智能助手
分类: 计算和语言, 人工智能, 新兴技术, 信息检索, 机器学习
作者: Krishanu Das Baksi, Elijah Soba, John J. Higgins, Ravi Saini, Jaden Wood, Jane Cook, Jack Scott, Nirmala Pudota, Tim Weninger, Edward Bowen, Sanmitra Bhattacharya
发布时间: 2024-09-18
链接: http://arxiv.org/abs/2409.15368v1
摘要: 医疗编码对于标准化临床数据和通信至关重要,但通常非常耗时且容易出错。由于标签空间大、文本输入冗长以及缺乏证明代码选择合理性的支持证据注释,传统自然语言处理 (NLP) 方法在自动化编码方面遇到了困难。生成人工智能 (AI) 的最新进展为这些挑战提供了有前景的解决方案。在这项工作中,我们介绍了 MedCodER,这是一种用于自动医疗编码的生成式 AI 框架,利用提取、检索和重新排序技术作为核心组件。 MedCodER 在国际疾病分类 (ICD) 代码预测方面取得了 0.60 的 micro-F1 分数,显着优于最先进的方法。此外,我们还提供了一个新的数据集,其中包含带有疾病诊断注释的医疗记录、ICD 代码和支持证据文本 (https://doi.org/10.5281/zenodo.13308316)。消融测试证实,MedCodER 的性能取决于其上述每个组件的集成,因为当单独评估这些组件时,性能会下降。
MPAI:具有 MPSoC 和 AI 加速器的协处理架构,适用于太空视觉应用
分类: 硬件架构, 新兴技术
作者: Vasileios Leon, Panagiotis Minaidis, Dimitrios Soudris, George Lentaris
发布时间: 2024-09-18
链接: http://arxiv.org/abs/2409.12258v1
摘要: 对在航天器上快速、高效部署 AI/ML 的新兴需求迫使航天工业研究专用加速器,这些加速器已成功用于地面应用。朝着这个方向,当前的工作引入了一种非常异构的协处理架构,该架构围绕 UltraScale+ MPSoC 及其可编程 DPU 以及 MyriadX VPU 和 Edge TPU 等商业 AI/ML 加速器构建。所提出的架构称为 MPAI,可处理不同规模/复杂性的网络,并通过利用加速器在精度和计算能力方面的多样性来实现速度-准确度-能量的权衡。本简介提供了技术背景并报告了初步实验结果和结果。
具有量子误差检测的量子近似优化性能
分类: 量子物理学, 新兴技术
作者: Zichang He, David Amaro, Ruslan Shaydulin, Marco Pistoia
发布时间: 2024-09-18
链接: http://arxiv.org/abs/2409.12104v1
摘要: 量子算法必须扩大规模以应对现实世界的应用。这样做需要克服当今硬件上存在的噪音。量子近似优化算法 (QAOA) 是一种很有前景的扩展候选算法,因为它的资源需求适中,并且在某些问题上比最先进的经典算法有记录的渐近加速。然而,使用 QAOA 实现优于经典的性能被认为需要容错能力。在本文中,我们使用 $[[k+2,k,2]]$ ``Iceberg'' 错误检测代码演示了 QAOA 的部分容错实现。我们观察到,对于捕获离子量子计算机上高达 20 美元逻辑量子位的问题,使用 Iceberg 代码对电路进行编码与未编码电路相比可以提高算法性能。此外,我们提出并校准了一个用于预测代码性能的模型,并用它来描述 Iceberg 代码的局限性,并将其性能推断为未来硬件的错误率得到改善。特别是,我们展示了如何使用我们的模型来确定 QAOA 在未来硬件上超越 Goemans-Williamson 算法的必要条件。我们的结果展示了迄今为止在实际应用中受部分容错量子错误检测保护的最大通用量子计算算法,为使用量子计算机解决实际应用铺平了道路。
CEF:连接精细的联邦 QKD 网络
分类: 网络和互联网架构, 密码学和安全, 新兴技术
作者: Alin-Bogdan Popa, Pantelimon Popescu
发布时间: 2024-09-18
链接: http://arxiv.org/abs/2409.12027v1
摘要: 随着 QKD 基础设施在由不同参与者(通常是国家政府)开发的过程中变得越来越复杂,将它们互连成一个由非常复杂的子网络组成的联邦网络,并保持高度自治将带来独特的挑战。我们确定了几个此类挑战,并提出了一个 4 步编排框架来基于集中研究、目标网络规划、最佳 QKD 设计和协议执行来解决这些挑战。
检索、注释、评估、重复:利用多模式大语言模型进行大规模产品检索评估
分类: 信息检索, 人工智能, 计算和语言, 新兴技术, 人机交互
作者: Kasra Hosseini, Thomas Kober, Josip Krapac, Roland Vollgraf, Weiwei Cheng, Ana Peleteiro Ramallo
发布时间: 2024-09-18
链接: http://arxiv.org/abs/2409.11860v1
摘要: 由于大量训练有素的人类注释者的可用性有限,大规模评估生产级检索系统是一项至关重要但具有挑战性的任务。大型语言模型 (LLM) 有潜力解决这一扩展问题,并为人类完成大量注释任务提供可行的替代方案。在本文中,我们提出了一个在大规模电子商务环境中评估产品搜索引擎的框架,利用多模式大语言模型(i)为单个查询生成定制的注释指南,以及(ii)执行后续注释任务。我们的方法通过在大型电子商务平台上的部署进行了验证,展示了与人工注释相当的质量,显着减少了时间和成本,有助于快速发现问题,并为大规模生产级质量控制提供了有效的解决方案。
自对比前向前向算法
分类: 机器学习, 人工智能, 计算机视觉和模式识别, 新兴技术, 神经和进化计算
作者: Xing Chen, Dongshu Liu, Jeremie Laydevant, Julie Grollier
发布时间: 2024-09-17
链接: http://arxiv.org/abs/2409.11593v1
摘要: 前向-前向 (FF) 算法是一种最新的纯前向模式学习方法,可局部和逐层更新权重,并支持监督学习和无监督学习。这些功能使其成为类脑学习、低功耗硬件神经网络和大型模型中的分布式学习等应用的理想选择。然而,虽然 FF 在书面数字识别任务上表现出了希望,但其在自然图像和时间序列上的性能仍然是一个挑战。一个关键的限制是需要为对比学习生成高质量的反例,特别是在目前缺乏通用解决方案的无监督任务中。为了解决这个问题,我们引入了自我对比前向(SCFF)方法,其灵感来自自监督对比学习。 SCFF 生成适用于不同数据集的正例和负例,超越了现有的本地前向算法,在 MNIST (MLP: 98.7%)、CIFAR-10 (CNN: 80.75%) 和 STL-10 (CNN: 77.3%) 上的无监督分类精度。此外,SCFF 是第一个支持循环神经网络 FF 训练的技术,为更复杂的任务以及连续时间视频和文本处理打开了大门。
克服铸造碳纳米管晶体管的环境漂移和负偏压温度不稳定性
分类: 新兴技术, 应用物理
作者: Andrew Yu, Tathagata Srimani, Max Shulaker
发布时间: 2024-09-17
链接: http://arxiv.org/abs/2409.11297v1
摘要: 后段生产线 (BEOL) 逻辑集成正在成为补充前段生产线 (FEOL) 芯片的补充扩展路径。在 BEOL 逻辑的各种选项中,碳纳米管场效应晶体管 (CNFET) 已集成在商业硅代工厂内,并且复杂的 CNFET 电路(例如 RISC-V 内核、SRAM 阵列)已得到验证。然而,缺乏分析 CNFET 的环境漂移(即空气稳定性)和可靠性的综合研究。在这里,我们首次全面描述并演示了如何使用以下技术克服 CNFET 中的环境漂移和负偏压温度不稳定性 (NBTI):(1) 氮化硅封装,以限制环境大气引起的阈值电压偏移(降低约 8 倍) 90 天内的中位 VT 偏移)和 (2) 与宽频率范围内的直流操作相比,交流/脉冲操作可显着改善 CNFET NBTI(例如,10 MHz 下的 20% 占空比交流操作可延长 CNFET NBTI 时间对于目标 VT 偏移容差 < 100 mV(栅极应力偏置 VGS,应力 = -1.2 V(125 C)),与 DC 相比,故障 >10000x。
LoRa 农业通信 4.0:机遇、挑战和未来方向
分类: 网络和互联网架构, 新兴技术, 机器学习
作者: Lameya Aldhaheri, Noor Alshehhi, Irfana Ilyas Jameela Manzil, Ruhul Amin Khalil, Shumaila Javaid, Nasir Saeed, Mohamed-Slim Alouini
发布时间: 2024-09-17
链接: http://arxiv.org/abs/2409.11200v1
摘要: 智能农业这一新兴领域利用物联网 (IoT) 彻底改变农业实践。本文研究了远程 (LoRa) 技术作为农业物联网系统远程无线通信关键推动者的变革潜力。通过回顾现有文献,我们从智能农业通信的角度发现了专门针对 LoRa 的前景和挑战的研究空白。我们深入研究基于 LoRa 的农业网络的细节,包括网络架构设计、针对农业环境量身定制的物理层 (PHY) 考虑因素以及考虑土壤特性的通道建模技术。本文进一步探讨了中继和路由机制,以解决在广阔的农业景观中扩展网络覆盖范围和优化数据传输的挑战。转向实际方面,我们讨论传感器部署策略和能源管理技术,为实际部署提供见解。 LoRa 与农业物联网应用中使用的其他无线通信技术的比较分析突出了其在这方面的优势和劣势。此外,本文还概述了利用基于 LoRa 的农业 4.0 潜力的几个未来研究方向。其中包括针对不同农业环境的通道建模的进步、新颖的中继路由算法、集成新兴传感器技术(如高光谱成像和基于无人机的传感)、设备上人工智能(AI)模型和可持续解决方案。这项调查可以指导研究人员、技术人员和从业人员了解、实施和推动使用 LoRa 技术的智能农业计划。
基于忆阻器的神经形态系统中的对比学习
分类: 神经和进化计算, 新兴技术, 神经元和认知
作者: Cory Merkel, Alexander Ororbia
发布时间: 2024-09-17
链接: http://arxiv.org/abs/2409.10887v1
摘要: 尖峰神经网络是第三代人工神经网络,已成为基于神经元的模型的一个重要家族,它回避了现代反向传播训练的深度网络面临的许多关键限制,包括其高能量效率低下和长期批评的生物学不合理性。在这项工作中,我们设计并研究了对比信号依赖可塑性(CSDP)的概念验证实例,这是一种基于前向、无反向传播学习的神经形态形式。我们的实验模拟表明,CSDP 的硬件实现能够学习简单的逻辑函数,而无需诉诸复杂的梯度计算。
挑战公平:全面探讨大语言模型推荐中的偏见
分类: 信息检索, 人工智能, 新兴技术, 机器学习
作者: Shahnewaz Karim Sakib, Anindya Bijoy Das
发布时间: 2024-09-17
链接: http://arxiv.org/abs/2409.10825v1
摘要: 基于大语言模型(LLM)的推荐系统通过深入分析内容和用户行为,提供比传统系统更全面的推荐。然而,这些系统经常表现出偏见,偏向主流内容,同时由于训练数据的偏差而边缘化非传统选项。这项研究调查了偏见与基于大语言模型的推荐系统之间的复杂关系,重点关注不同人口和文化群体的音乐、歌曲和书籍推荐。通过对不同的大语言模型模型进行综合分析,本文评估了偏见对推荐结果的影响。我们的研究结果表明,偏见在这些系统中根深蒂固,即使是像即时工程这样更简单的干预措施也可以显着减少偏见,凸显了这个问题的普遍性。此外,交叉身份和社会经济地位等背景信息等因素进一步放大了这些偏见,表明在不同群体之间创建公平建议所面临的挑战的复杂性和深度。
用于半导体制造的量子机器学习:GaN HEMT 接触过程建模
分类: 机器学习, 新兴技术, 量子物理学
作者: Zeheng Wang, Fangzhou Wang, Liang Li, Zirui Wang, Timothy van der Laan, Ross C. C. Leon, Jing-Kai Huang, Muhammad Usman
发布时间: 2024-09-17
链接: http://arxiv.org/abs/2409.10803v1
摘要: 本文开创性地首次使用量子机器学习 (QML) 对 GaN 高电子迁移率晶体管 (HEMT) 中的欧姆接触过程进行建模。利用来自 159 个设备的数据和基于变分自动编码器的增强,我们开发了一种具有 2 级 ZZ 特征图的基于量子内核的回归器 (QKR)。通过对六种经典机器学习 (CML) 模型进行基准测试,我们的 QKR 始终表现出最低的平均绝对误差 (MAE)、均方误差 (MSE) 和均方根误差 (RMSE)。重复的统计分析证实了其稳健性。此外,实验验证了 MAE 为 0.314 ohm-mm,凸显了 QKR 的卓越性能和半导体应用潜力,并展示了相对于传统 CML 方法的显着进步。
Pennsieve:转化神经科学及其他领域的协作平台
分类: 计算机与社会, 数据库, 数字图书馆, 新兴技术, H.2.4; H.3; J.3
作者: Zack Goldblum, Zhongchuan Xu, Haoer Shi, Patryk Orzechowski, Jamaal Spence, Kathryn A Davis, Brian Litt, Nishant Sinha, Joost Wagenaar
发布时间: 2024-09-16
链接: http://arxiv.org/abs/2409.10509v2
摘要: 神经科学数据的指数级增长需要促进数据管理和多学科协作的平台。在本文中,我们介绍 Pennsieve - 一个开源的、基于云的科学数据管理平台,旨在满足这些需求。 Pennsieve 支持复杂的多模式数据集,并提供数据可视化和分析工具。它采用全面的数据集成方法,使研究人员能够定义自定义元数据模式并利用高级工具来过滤和查询数据。 Pennsieve 的模块化架构允许外部应用程序扩展其功能,并且具有同行评审数据发布机制的协作工作区可促进针对云中和本地的下游分析进行优化的高质量数据集。 Pennsieve 构成了主要神经科学研究项目的核心,包括 NIH SPARC Initiative、NIH HEAL Initiative 的 PRECISION Human Pain Network 和 NIH HEAL RE-JOIN Initiative。它为全球 80 多个研究小组提供服务,并通过宾夕法尼亚大学在临床中心开展多个大型机构间项目。 Pennsieve 是 SPARC.Science、Epilpsy.Science 和 Pennsieve Discover 门户的基础,存储了超过 125 TB 的科学数据,其中 35 TB 的数据可公开获取,涵盖 350 多个高影响力的数据集。它遵循可查找、可访问、可互操作和可重用 (FAIR) 的数据共享原则,并被公认为 NIH 批准的数据存储库之一。通过促进科学数据管理、发现和分析,Pennsieve 为神经科学及其他领域培育了一个强大的协作研究生态系统。
Pennsieve - 转化神经科学及其他领域的协作平台
分类: 计算机与社会, 数据库, 数字图书馆, 新兴技术, H.2.4; H.3; J.3
作者: Zack Goldblum, Zhongchuan Xu, Haoer Shi, Patryk Orzechowski, Jamaal Spence, Kathryn A Davis, Brian Litt, Nishant Sinha, Joost Wagenaar
发布时间: 2024-09-16
链接: http://arxiv.org/abs/2409.10509v1
摘要: 神经科学数据的指数级增长需要促进数据管理和多学科协作的平台。在本文中,我们介绍 Pennsieve - 一个开源的、基于云的科学数据管理平台,旨在满足这些需求。 Pennsieve 支持复杂的多模式数据集,并提供数据可视化和分析工具。它采用全面的数据集成方法,使研究人员能够定义自定义元数据模式并利用高级工具来过滤和查询数据。 Pennsieve 的模块化架构允许外部应用程序扩展其功能,并且具有同行评审数据发布机制的协作工作区可促进针对云中和本地的下游分析进行优化的高质量数据集。 Pennsieve 构成了主要神经科学研究项目的核心,包括 NIH SPARC Initiative、NIH HEAL Initiative 的 PRECISION Human Pain Network 和 NIH HEAL RE-JOIN Initiative。它为全球 80 多个研究小组提供服务,并通过宾夕法尼亚大学在临床中心开展多个大型机构间项目。 Pennsieve 是 SPARC.Science、Epilpsy.Science 和 Pennsieve Discover 门户的基础,存储了超过 125 TB 的科学数据,其中 35 TB 的数据可公开获取,涵盖 350 多个高影响力的数据集。它遵循可查找、可访问、可互操作和可重用 (FAIR) 的数据共享原则,并被公认为 NIH 批准的数据存储库之一。通过促进科学数据管理、发现和分析,Pennsieve 为神经科学及其他领域培育了一个强大的协作研究生态系统。
PASS:下一代智能的异步概率处理器
分类: 分布式、并行和集群计算, 硬件架构, 新兴技术, 数据分析、统计和概率
作者: Saavan Patel, Philip Canoza, Adhiraj Datar, Steven Lu, Chirag Garg, Sayeef Salahuddin
发布时间: 2024-09-16
链接: http://arxiv.org/abs/2409.10325v1
摘要: 需要新的计算范式来解决不存在精确多项式时间解的最具挑战性的计算问题。概率伊辛加速器在这些问题上获得了前景,能够对复杂的概率分布进行建模并找到棘手问题的基态。在此背景下,我们展示了并行异步随机采样器 (PASS),这是第一个完全片上集成的异步概率加速器,它利用伊辛模型固有的细粒度并行性,并内置于最先进的 14nm 工艺中CMOS FinFET 技术。我们已经证明了该加速器在组合优化、神经模拟和机器学习等问题上的广泛适用性,与概率问题上的 CPU 相比,解决方案改进的能耗高达 23,000 美元。
Count2Multiply:可靠的内存高基数计数
分类: 硬件架构, 新兴技术
作者: João Paulo Cardoso de Lima, Benjamin Franklin Morris III, Asif Ali Khan, Jeronimo Castrillon, Alex K. Jones
发布时间: 2024-09-16
链接: http://arxiv.org/abs/2409.10136v1
摘要: 由于内存到处理器的带宽瓶颈,大数据处理暴露了以计算为中心的硬件加速的局限性。因此,人们开始转向以内存为中心的架构,通过直接使用内存元素进行处理来充分利用大量的计算并行性。针对传统和新兴内存技术的内存计算 (CIM) 提案通常针对大规模并行操作。然而,当前的 CIM 解决方案面临着重大挑战。对于新兴的数据密集型应用,例如先进的机器学习技术和生物信息学,其中矩阵乘法是关键原语,忆阻器交叉开关的写入耐久性有限且写入操作昂贵。相比之下,虽然基于 DRAM 的解决方案已成功演示了使用加法的乘法,但它们的速度仍然慢得令人望而却步。本文介绍了 Count2Multiply,这是一种与技术无关的数字 CIM 方法,用于使用通过按位逻辑运算实现的高基数、大规模并行计数来执行整数-二进制和整数-整数矩阵乘法。此外,Count2Multiply 在设计时考虑到了容错能力,并利用传统的可扩展行式纠错码(例如 Hamming 和 BCH 码)来防止现有 CIM 设计的高错误率。由于 Count2Multiply 的普遍性和高耐用性,我们通过在传统 DRAM 中 CIM 的详细应用来演示 Count2Multiply。我们还探索了赛道存储器的加速潜力,因为它们具有移位特性(这对于 Count2Multiply 来说是自然的)以及它们的高耐用性。与最先进的 DRAM 方法相比,Count2Multiply 可实现高达 10 倍的加速、3.8 倍的 GOPS/瓦特和 1.4 倍的 GOPS/面积,而 RTM 对应方案则提供 10 倍、57 倍和 3.8 倍的增益x。
以基于层的方法分析对区块链系统的攻击
分类: 密码学和安全, 新兴技术
作者: Joydip Das, Syed Ashraf Al Tasin, Md. Forhad Rabbi, Md Sadek Ferdous
发布时间: 2024-09-16
链接: http://arxiv.org/abs/2409.10109v1
摘要: 区块链是一个不断发展的去中心化系统,旨在实现透明度和不变性。基于区块链的系统已经发生过几次重大攻击,导致该系统的可信度存在差距。本文对区块链系统的 23 种攻击进行了全面研究,并使用基于层的方法对它们进行了分类。这种方法提供了对这些攻击的可行性和动机的深入分析。此外,还提出了一个框架,可以对这些攻击的影响和相互关联进行系统分析,从而提供识别潜在攻击向量并设计适当对策以加强任何区块链系统的方法。
用于负载频率控制的鲁棒分散观测器和控制器的集成设计
分类: 系统与控制, 新兴技术, 系统与控制, 优化与控制
作者: Xianxian Zhao, Jianglin Lan
发布时间: 2024-09-16
链接: http://arxiv.org/abs/2409.10098v1
摘要: 本文重点为多区域电力系统设计完全分散的负载频率控制(LFC),以实现全局优化性能。为此,引入了一种新的集成设计概念,通过考虑区域之间的相互作用以及每个区域中本地观察器和控制器之间的双向效应,来同时离线设计分散的LFC观察器和控制器。本文中的集成设计是通过单步线性矩阵不等式(LMI)公式的$H_\infty$优化来实现的。 LMI区域特征值分配技术进一步与$H_\infty$优化相结合,以提高闭环系统瞬态性能。对三区域电力系统进行了仿真,以验证所提出的集成设计相对于传统分散设计的优越性。
探索现实世界仓库优化问题的效用:基于量子退火器的公式和初步结果
分类: 新兴技术, 人工智能
作者: Eneko Osaba, Esther Villar-Rodriguez, Antón Asla
发布时间: 2024-09-15
链接: http://arxiv.org/abs/2409.09706v2
摘要: 在当前的 NISQ 时代,研究人员和实践者面临的主要挑战之一在于如何以最高效和创新的方式将量子计算和经典计算结合起来。在本文中,我们提出了一种称为仓库优化问题的量子初始化的机制,该机制采用 D-Wave 的量子退火器。该模块经过专门设计,可以嵌入到现有的经典软件中,专门用于优化现实世界的工业问题。我们通过针对经典版本软件的两阶段实验初步测试了所实现的机制。
检测变得简单:大型语言模型针对 Solidity 漏洞的潜力
分类: 密码学和安全, 人工智能, 新兴技术, 机器学习
作者: Md Tauseef Alam, Raju Halder, Abyayananda Maiti
发布时间: 2024-09-15
链接: http://arxiv.org/abs/2409.10574v1
摘要: 近年来,Solidity 智能合约在以太坊主网上的大规模部署越来越多地吸引了出于经济动机的攻击者。以太坊历史上一些现在臭名昭著的攻击包括 2016 年的 DAO 攻击(损失 5000 万美元)、2017 年的 Parity Wallet 黑客攻击(锁定 1.46 亿美元)、2018 年 Beautychain 的代币 BEC(9 亿美元市值跌至 0),以及2022 年 NFT 游戏区块链泄露(价值 6 亿美元的以太币被盗)。本文对大型语言模型 (LLM) 的使用及其检测 Solidity 中 OWASP 十大漏洞的能力进行了全面调查。我们引入了一个名为 VulSmart 的新型、类平衡、结构化和标记数据集,我们用它来对 CodeLlama、Llama2、CodeT5 和 Falcon 等开源 LLM 以及 GPT-3.5 等闭源模型的性能进行基准测试和比较Turbo 和 GPT-4o Mini。我们提出的 SmartVD 框架通过广泛的自动和手动评估对这些模型进行了严格测试,利用 BLEU 和 ROUGE 指标来评估智能合约中漏洞检测的有效性。我们还探索了三种不同的提示策略——零样本、少样本和思维链——来评估 SmartVD 框架的多类分类和生成能力。我们的研究结果表明,SmartVD 的性能优于开源模型,甚至超过了 GPT-3.5 和 GPT-4 Mini 等闭源基础模型的性能。经过微调,闭源模型 GPT-3.5 Turbo 和 GPT-4o Mini 取得了显着的性能,漏洞检测准确率达到 99%,识别漏洞类型的准确率达到 94%,确定严重程度的准确率达到 98%。值得注意的是,SmartVD 在“思想链”提示技术中表现最佳,而经过微调的闭源模型在“零样本”提示方法中表现出色。
以 GPU 为中心的通信格局
分类: 分布式、并行和集群计算, 新兴技术, 表现
作者: Didem Unat, Ilyas Turimbetov, Mohammed Kefah Taha Issa, Doğan Sağbili, Flavio Vella, Daniele De Sensi, Ismayil Ismayilov
发布时间: 2024-09-15
链接: http://arxiv.org/abs/2409.09874v1
摘要: 近年来,GPU 因其并行性和快速内存带宽而成为 HPC 和 ML 应用程序的首选加速器。虽然 GPU 可以提高计算能力,但 GPU 间的通信可能会造成可扩展性瓶颈,尤其是随着每个节点和集群的 GPU 数量的增长。传统上,CPU 管理多 GPU 通信,但以 GPU 为中心的通信的进步现在通过减少 CPU 的参与、在通信任务中赋予 GPU 更多自主权以及解决多 GPU 通信和计算中的不匹配问题来挑战 CPU 的主导地位。本文提供了以 GPU 为中心的通信的概况,重点关注供应商机制和用户级库支持。它的目的是澄清该领域的复杂性和多样化的选择,定义术语,并对节点内和跨节点的现有方法进行分类。本文讨论了供应商提供的多 GPU 执行中的通信和内存管理机制,并回顾了主要的通信库、它们的优点、挑战和性能见解。然后,它探讨了关键的研究范式、未来展望和开放的研究问题。通过广泛描述跨软件和硬件堆栈的以 GPU 为中心的通信技术,我们为研究人员、程序员、工程师和库设计人员提供了如何充分利用多 GPU 系统的见解。
全球视角看待星链视频流的过去、现在和未来
分类: 网络和互联网架构, 新兴技术, 多媒体, 表现
作者: Liz Izhikevich, Reese Enghardt, Te-Yuan Huang, Renata Teixeira
发布时间: 2024-09-15
链接: http://arxiv.org/abs/2409.09846v1
摘要: 这项研究利用来自 85 个国家超过 100 万个家庭的数据,首次对低地球轨道 (LEO) 卫星网络上的点播视频流进行了全球分析。我们强调 Starlink 作为主要 LEO 提供商的作用,增强了服务欠缺地区的连接性。我们的研究结果表明,虽然 Starlink 上的整体视频质量与传统网络相匹配,但 LEO 条件的固有变化(例如吞吐量波动和数据包丢失)导致比特率切换和重新缓冲的增加。为了进一步提高 LEO 社区的体验质量,我们使用在超过 100 万个家庭中部署的模拟和真实 A/B 测试来操纵现有的拥塞控制和自适应比特率流算法。我们的结果强调了视频流和拥塞控制算法的需求,以适应快速发展的网络环境,确保跨多样化和动态网络类型的高质量服务。
高清地图绘制和更新:总体概述和未来方向
分类: 机器人技术, 新兴技术
作者: Benny Wijaya, Kun Jiang, Mengmeng Yang, Tuopu Wen, Yunlong Wang, Xuewei Tang, Zheng Fu, Taohua Zhou, Diange Yang
发布时间: 2024-09-15
链接: http://arxiv.org/abs/2409.09726v1
摘要: 随着自动驾驶汽车(AV)的快速增长,对环境感知技术的需求越来越大。其中,高清地图已成为帮助车辆实现定位、路径规划等基本任务的较为突出的角色之一。与此同时,越来越多的研究工作已转向高精地图的开发。然而,仍然缺乏对整体高精地图测绘和更新框架的全面概述。本文介绍了高精地图绘制及其维护所涉及的算法的发展和现状。作为本研究的一部分,还简要回顾了将原始数据处理为准备用于映射和更新目的的信息的主要数据预处理方法、语义分割和本地化。此外,还广泛讨论了地图分类、本体和质量评估,提出了地图数据的一般表示方法,并讨论了从 SLAM 到基于 Transformer 学习的方法的地图算法。还介绍了高精地图更新算法的发展,从变化检测到更新方法。最后,作者讨论了高精地图测绘和更新技术未来可能的发展和剩余挑战。本文同时作为高精地图制图和更新领域新手的立场文件和教程。
探索现实世界仓库优化问题的实用性:基于 Quantun 退火器的公式和初步结果
分类: 新兴技术, 人工智能
作者: Eneko Osaba, Esther Villar-Rodriguez, Antón Asla
发布时间: 2024-09-15
链接: http://arxiv.org/abs/2409.09706v1
摘要: 在当前的 NISQ 时代,研究人员和实践者面临的主要挑战之一在于如何以最高效和创新的方式将量子计算和经典计算结合起来。在本文中,我们提出了一种称为仓库优化问题的量子初始化的机制,该机制采用 D-Wave 的量子退火器。该模块经过专门设计,可以嵌入到现有的经典软件中,专门用于优化现实世界的工业问题。我们通过针对经典版本软件的两阶段实验初步测试了所实现的机制。
协同模拟:使用大型语言模型解决多智能体问题
分类: 多代理系统, 人工智能, 计算和语言, 新兴技术
作者: Asher Sprigler, Alexander Drobek, Keagan Weinstock, Wendpanga Tapsoba, Gavin Childress, Andy Dao, Lucas Gral
发布时间: 2024-09-14
链接: http://arxiv.org/abs/2409.13753v1
摘要: 大型语言模型(LLM)越来越多地证明了促进多智能体系统开发的能力,该系统允许解释每个人产生的思想和行动。基于大语言模型的与现有世界的交互,特别是与模拟环境的交互,也取得了有希望的进步。本文旨在将上述两个主题(智能体和世界交互)整合到一个模拟中,多个智能体可以一起工作来解决问题,模拟人类群体通常如何比个人更好地解决问题。通过展示大语言模型是否表现出人类协作的协同作用,它可能会导致大语言模型应用的进步。我们实现了两个模拟:一个有两个室友的物理单间公寓,另一个是代理协作完成编程任务。我们提供了一个多代理框架,讨论了每次模拟中代理的性能,并讨论了未来可能添加的内容。
量子数据编码作为量子电路设计中独特的抽象层
分类: 新兴技术, 量子物理学
作者: Gabriele Agliardi, Enrico Prati
发布时间: 2024-09-14
链接: http://arxiv.org/abs/2409.09339v1
摘要: 复杂的量子电路由量子子程序的组合构成。只要量子数据编码在整个电路中保持一致,计算就是可能的。尽管量子数据编码的形式化具有根本性的重要性,但迄今为止尚未得到系统的解决。我们将量子数据编码的概念形式化,即通过量子态提供数据集表示的格式,作为相关数据加载电路的独特抽象层。我们调查了现有的编码方法及其各自的策略,用于经典到量子的精确和近似数据加载、从状态中提取信息的量子到经典以及量子到量子编码转换。接下来,我们展示主要的量子算法如何在数据加载方面找到自然的解释。例如,量子傅里叶变换被描述为量子编码转换器,而量子振幅估计被描述为提取例程。新的概念框架通过考虑其在基于量子的蒙特卡罗模拟中的应用来举例说明,从而展示了所提出的形式主义在描述复杂量子电路方面的力量。事实上,该方法阐明了复杂量子电路的结构并使其能够有效设计。
ProcessTBench:用于流程挖掘的 LLM 计划生成数据集
分类: 机器学习, 人工智能, 新兴技术
作者: Andrei Cosmin Redis, Mohammadreza Fani Sani, Bahram Zarrin, Andrea Burattin
发布时间: 2024-09-13
链接: http://arxiv.org/abs/2409.09191v1
摘要: 大型语言模型 (LLM) 在计划生成方面显示出了巨大的前景。然而,现有数据集通常缺乏高级工具使用场景所需的复杂性,例如处理释义查询语句、支持多种语言以及管理可以并行完成的操作。这些场景对于评估大语言模型在现实应用中不断发展的能力至关重要。此外,当前的数据集无法从流程角度对大语言模型进行研究,特别是在了解在不同条件或配方下执行同一流程的典型行为和挑战至关重要的情况下。为了解决这些差距,我们提出了 ProcessTBench 数据集,这是 TaskBench 数据集的扩展,专门设计用于评估流程挖掘框架内的 LLM。
内存计算的分布式二进制优化:SAT 问题的应用
分类: 新兴技术, 硬件架构, 优化与控制
作者: Xiangyi Zhang, Ignacio Rozada, Fabian Böhm, Elisabetta Valiante, Moslem Noori, Thomas Van Vaerenbergh, Chan-Woo Yang, Giacomo Pedretti, Masoud Mohseni, Raymond Beausoleil
发布时间: 2024-09-13
链接: http://arxiv.org/abs/2409.09152v1
摘要: 内存计算 (IMC) 已被证明是解决二进制优化问题的一种有前景的方法,同时可以显着降低能耗和延迟。基于并行计算的优势,我们提出了一种受并行调优(PT)启发的兼容 IMC 的并行框架,支持跨副本通信以提高 IMC 求解器的性能。该框架使 IMC 求解器不仅能够提高并行化所能达到的性能,而且还能以较低的硬件开销为搜索过程提供更大的灵活性。我们证明该框架可以应用于几乎所有 IMC 求解器。我们使用 WalkSAT 启发式作为现有 IMC 求解器的代理,展示了布尔可满足性 (SAT) 问题框架的有效性。由此产生的受 PT 启发的协作 WalkSAT (PTIC-WalkSAT) 算法在 76.3% 的测试问题实例中的迭代解决方案方面优于传统的 WalkSAT 启发式算法,并且其原生并行变体 (PA-WalkSAT) 也做到了这一点在 68.4% 的实例中,对两种硬件加速器架构的 PTIC 框架的能源开销的估计表明,在这两种情况下,运行 PTIC 框架的开销将小于运行每个加速器所需的总能源的 1%。
更好的解决方案概率指标:优化 QAOA 以超越其热启动解决方案
分类: 量子物理学, 数据结构和算法, 新兴技术, 数值分析, 数值分析
作者: Sean Feeney, Reuben Tate, Stephan Eidenbenz
发布时间: 2024-09-13
链接: http://arxiv.org/abs/2409.09012v1
摘要: 本文对 Tate 等人提出的热启动量子近似优化算法 (QAOA) 进行了数值模拟研究。 [1],重点关注其在 3-regular Max-Cut 问题中的应用。我们的研究表明,热启动 QAOA 在各种倾斜角度的近似比上始终优于理论下限,凸显了其在最坏情况预测之外的实际场景中的潜力。尽管有这些改进,具有针对期望值优化的传统参数的热启动 QAOA 并未超过初始经典解决方案的性能。为了解决这个问题,我们引入了另一种参数优化目标,即更好的解决方案概率(BSP)指标。我们的结果表明,BSP 优化的热启动 QAOA 识别出非平凡倾斜角度的解决方案,甚至比经典发现的具有非零概率的最佳热启动解决方案还要好。这些发现强调了理论和实证分析在完善 QAOA 和探索其量子优势潜力方面的重要性。
Farmer.Chat:为小农户扩展人工智能驱动的农业服务
分类: 新兴技术, 人工智能, 人机交互
作者: Namita Singh, Jacqueline Wang'ombe, Nereah Okanga, Tetyana Zelenska, Jona Repishti, Jayasankar G K, Sanjeev Mishra, Rajsekar Manokaran, Vineet Singh, Mohammed Irfan Rafiq, Rikin Gandhi, Akshay Nambi
发布时间: 2024-09-13
链接: http://arxiv.org/abs/2409.08916v1
摘要: 中小型农业所有者面临着诸如获取本地化、及时信息的机会有限、影响生产力和可持续性等挑战。传统的推广服务依赖于专人代理,在可扩展性和及时交付方面存在困难,尤其是在偏远地区。我们推出了 Farmer.Chat,这是一款由人工智能驱动的生成式聊天机器人,旨在解决这些问题。 Farmer.Chat 利用生成式人工智能,提供个性化、可靠且与上下文相关的建议,克服了以前的聊天机器人在确定性对话流、语言支持和非结构化数据处理方面的局限性。 Farmer.Chat 部署在四个国家,吸引了超过 15,000 名农民,并回答了超过 300,000 个查询。本文重点介绍了 Farmer.Chat 对 GenAI 的创新使用如何增强农业服务的可扩展性和有效性。我们的评估结合了定量分析和定性见解,强调了 Farmer.Chat 在改善农业实践、增强信任、响应质量和用户参与度方面的有效性。
通过进化异构系综来提高量子电路的可靠性
分类: 量子物理学, 新兴技术
作者: Owain Parry, John Clark, Phil McMinn
发布时间: 2024-09-13
链接: http://arxiv.org/abs/2409.09103v1
摘要: 量子计算机执行某些操作的速度比经典计算机快得多,但设计量子电路具有挑战性。为此,研究人员使用进化算法来生成概率量子电路,该电路对于任何输入都能够提供正确的输出。它们可以执行多次,并使用经典方法(例如投票)组合输出以产生最终输出,从而有效地创建同质的电路集合(即全部相同)。受 n 版本编程和集成学习的启发,我们开发了一种工具,使用进化算法生成异构电路集成(即全部不同),名为 QuEEn。我们用它来进化集成来解决鸢尾花分类问题。当使用理想模拟时,我们发现异质集成的性能在统计上显着地高于同质集成。当使用噪声模拟时,我们在大多数情况下仍然观察到统计上显着的改进。我们的结果表明,不断发展的异构系综是提高量子电路可靠性的有效策略。这在当前量子计算的 NISQ 时代尤其重要,因为计算机对量子噪声还没有很好的耐受性。
关于知识密集型应用领域内检索增强生成的脆弱性
分类: 密码学和安全, 人工智能, 计算和语言, 数据库, 新兴技术, 信息检索, 机器学习
作者: Xun Xian, Ganghua Wang, Xuan Bi, Jayanth Srinivasa, Ashish Kundu, Charles Fleming, Mingyi Hong, Jie Ding
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.17275v1
摘要: 经验表明,检索增强生成 (RAG) 可以提高大型语言模型 (LLM) 在医疗保健、金融和法律等知识密集型领域的性能。给定一个查询,RAG 从语料库中检索相关文档,并将它们集成到大语言模型的生成过程中。在本研究中,我们研究了 RAG 的对抗稳健性,特别关注检查检索系统。首先,通过语料库、检索器、查询和目标信息的 225 种不同设置组合,我们表明检索系统容易受到医学问答中的普遍中毒攻击。在此类攻击中,对手会生成包含广泛目标信息(例如个人身份信息)的中毒文档。当这些中毒文档被插入到语料库中时,只要使用攻击者指定的查询,任何用户都可以准确地检索它们。为了理解这个漏洞,我们发现查询嵌入与中毒文档嵌入的偏差往往遵循一种模式,即保留中毒文档和查询之间的高度相似性,从而实现精确检索。基于这些发现,我们开发了一种新的基于检测的防御,以确保 RAG 的安全使用。通过跨越各个问答领域的广泛实验,我们观察到我们提出的方法在几乎所有情况下都始终实现了出色的检测率。
大型语言模型的机器翻译:仅解码器与编码器-解码器
分类: 计算和语言, 新兴技术, 机器学习
作者: Abhinav P. M., SujayKumar Reddy M, Oswald Christopher
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.13747v1
摘要: 该项目名为“大型语言模型的机器翻译:仅解码器与编码器-解码器”,旨在开发多语言机器翻译(MT)模型。该模型专注于印度地方语言,特别是泰卢固语、泰米尔语和马拉雅拉姆语,力求在不同语言对之间实现准确且适合上下文的翻译。通过比较纯解码器和编码器-解码器架构,该项目旨在优化翻译质量和效率,推进跨语言通信工具。主要目标是开发一种能够提供准确且适合上下文的高质量翻译的模型。通过利用大型语言模型,特别是比较仅解码器和编码器-解码器架构的有效性,该项目旨在优化跨多语言环境的翻译性能和效率。通过严格的实验和分析,该项目旨在推动机器翻译领域的发展,为不同模型架构的有效性提供有价值的见解,并为增强的跨语言通信工具铺平道路。
迈向可扩展的量子网络
分类: 新兴技术, 网络和互联网架构
作者: Connor Howe, Mohsin Aziz, Ali Anwar
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.08416v1
摘要: 本文对量子通信网络中的可扩展性挑战和机遇进行了全面研究,目的是确定对网络影响最大的参数以及扩展网络时出现的趋势。我们设计了量子网络的模拟,该网络由由俘获离子量子位组成的路由器节点组成,并由贝尔状态测量(BSM)节点形式的量子中继器分隔开。这种网络有望安全地共享量子信息并实现高功率分布式量子计算。尽管有这样的承诺,量子网络还是因噪声和操作错误而遇到了可扩展性问题。通过模块化方法,我们的研究旨在克服这些挑战,重点关注扩展节点数量和间隔距离的影响,同时监测退相干效应引起的低质量通信。我们的目标是查明网络中对于推进可扩展的大规模量子计算系统至关重要的关键特征。我们的研究结果强调了几个网络参数对可扩展性的影响,强调了对中继器数量和生成的纠缠质量之间权衡的关键洞察。本文为未来探索优化量子网络设计和协议奠定了基础。
多种量子控制硬件的基于图形的脉冲表示
分类: 量子物理学, 新兴技术
作者: Aniket S. Dalvi, Leon Riesebos, Jacob Whitlow, Kenneth R. Brown
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.08407v1
摘要: 量子系统的脉冲级控制对于实现门实现、校准程序和哈密顿演化至关重要,而传统电路模型基本上不支持这些。这种级别的控制需要高效的生成和表示。在这项工作中,我们提出了pulselib——一种基于图形的脉冲级表示。图形结构的节点由参数化的基本波形组成,可存储所有高级脉冲信息,同时保持灵活地转换为特定于硬件的输入。我们通过将软件堆栈脉冲层的功能集和信息流与当前可用的脉冲表示进行比较来激发pulselib。我们描述了这种提议的表示的架构,它模仿经典编译管道中的抽象语法树(AST)模型。最后,我们概述了诸如捕获离子特定门和搁置脉冲方案之类的应用程序,由于pulselib的基于图形的架构,可以编写和表示其约束和实现。
E-QUARTIC:用于资源优化学习的卷积神经网络的节能边缘集成
分类: 分布式、并行和集群计算, 人工智能, 新兴技术, 表现
作者: Le Zhang, Onat Gungor, Flavio Ponzina, Tajana Rosing
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.08369v1
摘要: 集成学习是一种元学习方法,结合了多个学习者的预测,展示了更高的准确性和鲁棒性。然而,像卷积神经网络 (CNN) 这样的集成模型会导致较高的内存和计算开销,从而阻碍了它们在嵌入式系统中的部署。这些设备通常配备有提供电源的小型电池,并且可能包括从环境中提取能量的能量收集模块。在这项工作中,我们提出了 E-QUARTIC,这是一种新颖的节能边缘集成框架,用于构建针对基于人工智能 (AI) 的嵌入式系统的 CNN 集成。我们的设计优于单实例 CNN 基线和最先进的边缘 AI 解决方案,提高了准确性并适应不同的能源条件,同时保持类似的内存要求。然后,我们利用所设计的集成的多 CNN 结构在能量收集人工智能系统中实施能量感知模型选择策略。我们证明,我们的解决方案在确保更高的平均输出质量的同时,将系统故障率降低了 40%,优于最先进的解决方案。最终,我们表明,所提出的设计能够实现并发设备上训练和边缘的高质量推理执行,将性能和能源开销限制在 0.04% 以下。
LightSABRE:轻量级增强型 SABRE 算法
分类: 量子物理学, 新兴技术
作者: Henry Zou, Matthew Treinish, Kevin Hartman, Alexander Ivrii, Jake Lishman
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.08368v1
摘要: 我们推出了 LightSABRE,它是 SABRE 算法的显着增强,可提高运行时效率和电路质量。 LightSABRE 满足了现代量子硬件日益增长的需求,现代量子硬件现在可以适应复杂的场景和具有数百万个门的电路。通过 Qiskit 内的迭代开发(主要使用 Rust 编程语言),我们在 Qiskit 1.2.0 中实现了算法版本,该版本比 Qiskit 0.20.1 中的实现快约 200 倍,Qiskit 0.20.1 中已经引入了释放阀等关键改进机制。此外,与 Li 等人提出的 SABRE 算法相比,LightSABRE 在相同基准电路上的交换门数平均减少了 18.9%。与在大型电路上的可扩展性和融合方面苦苦挣扎的 SABRE 不同,LightSABRE 提供始终如一的高质量路由解决方案,从而能够在近期和未来的量子设备上高效执行大型量子电路。 LightSABRE 在速度、可扩展性和质量方面的改进使其成为在不断发展的量子硬件和纠错技术的背景下优化量子电路的关键工具。
平面磁畴壁人工突触中的尖峰时序依赖性可塑性学习
分类: 应用物理, 新兴技术
作者: J. O. Castro, B. Buyatti, D. Mercado, A. Di Donato, M. Quintero, M. Tortarolo
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.08055v1
摘要: 未来的神经形态架构将需要数百万个人工突触,因此必须了解其可塑性功能背后的物理机制。在这项工作中,我们提出了一种简化的自旋忆阻器,其电阻可以通过磁场脉冲控制,基于具有垂直磁各向异性的 Co/Pt 多层作为突触仿真器。我们展示了该器件的可塑性和尖峰时间依赖性可塑性(STDP),并使用克尔显微镜成像和霍尔磁输运测量探索了潜在的磁性机制。明确定义的磁化反转阈值和与微磁配置相关的连续电阻状态是该设备中允许可塑性和 STDP 学习机制的基本属性。
C3-VQA:用于变分量子算法的低温计数器协处理器
分类: 量子物理学, 硬件架构, 新兴技术
作者: Yosuke Ueno, Satoshi Imamura, Yuna Tomida, Teruo Tanimoto, Masamitsu Tanaka, Yutaka Tabuchi, Koji Inoue, Hiroshi Nakamura
发布时间: 2024-09-12
链接: http://arxiv.org/abs/2409.07847v1
摘要: 低温量子计算机在展示量子优势方面发挥着主导作用。鉴于低温环境中冷却能力的严格限制,热设计对于这些计算机的可扩展性至关重要。散热源包括通过温度间导线的被动流入以及位于低温恒温器中的组件的功耗,例如导线放大器和量子经典接口。因此,一个关键的挑战是通过减少所需的温度间带宽来减少电线数量,同时保持低温恒温器中的额外功耗最小。解决这一挑战的一种解决方案是在低温恒温器内使用超低功耗计算逻辑进行近数据处理。基于以变分量子算法(VQA)为重点的工作负载分析和特定领域系统设计,我们提出了基于低温计数器的VQA协处理器(C3-VQA),以增强低温量子计算机在热约束下的设计可扩展性。 C3-VQA采用单通量量子逻辑,这是一种在4K环境下运行的超低功耗超导数字电路。 C3-VQA预先计算VQA的部分期望值计算,并使用低温恒温器中的简单位操作单元和计数器缓冲中间值,从而以较小的额外功耗减少所需的温度间带宽。因此,C3-VQA 减少了电线数量,从而减少了低温恒温器的总散热量。我们的评估表明,在顺序拍摄和并行拍摄执行场景下,C3-VQA 在 4 K 阶段的总散热量分别降低了 30% 和 81%。此外,量子化学的案例研究表明,C3-VQA 将 10,000 量子位系统的总散热量降低了 87%。
界定可持续协作混合现实的范围
分类: 计算机与社会, 分布式、并行和集群计算, 新兴技术, 系统与控制, 系统与控制
作者: Yasra Chandio, Noman Bashir, Tian Guo, Elsa Olivetti, Fatima Anwar
发布时间: 2024-09-11
链接: http://arxiv.org/abs/2409.07640v1
摘要: 混合现实 (MR) 正在变得无处不在,因为它在教育、医疗保健和休闲以外的其他领域都有应用。虽然耳机等 MR 终端设备的能源强度较低,但包括云和边缘端点在内的整个 MR 生态系统的设备总数和资源需求可能非常巨大。由此产生的 MR 运营碳足迹和具体碳足迹引发了人们对其环境影响的担忧。最近的研究通过探索硬件设计空间或网络优化来探索减少 MR 设备的碳足迹。然而,增强 MR 可持续性的许多其他途径仍然开放,包括非处理器组件的节能以及协作 MR 生态系统中的碳感知优化。在本文中,我们的目标是确定提高 MR 可持续性的关键挑战、现有解决方案和有前途的研究方向。我们探索嵌入式和移动计算系统的邻近领域以获取见解,并概述需要新解决方案的 MR 特定问题。我们确定了必须解决的挑战,以使研究人员、开发人员和用户能够利用协作 MR 系统中的这些机会。
开发可听化变分量子算法的框架:对音乐创作的影响
分类: 声音, 新兴技术, 人机交互, 音频和语音处理, 量子物理学
作者: Paulo Vitor Itaboraí, Peter Thomas, Arianna Crippa, Karl Jansen, Tim Schwägerl, María Aguado Yáñez
发布时间: 2024-09-11
链接: http://arxiv.org/abs/2409.07104v1
摘要: 本章研究变分量子协调器,这是一种软件工具和音乐界面,重点关注变分量子算法(VQA)最小化步骤的声音化问题,用于模拟量子系统的特性和量子硬件辅助的优化问题。特别是,它详细介绍了使用 VQA 的二次无约束二元优化 (QUBO) 问题的声音化。灵活的设计使其未来的应用既可以作为科学研究中听觉显示的发声工具,也可以作为艺术创作中的混合量子数字乐器。反过来,可听化可以帮助研究人员更好地理解复杂系统,并可以用于量子物理和量子计算的训练。详细介绍了 VQH 结构,包括其软件实现、控制机制和可听化映射。此外,它还指导 VQH 中作为音乐创作对象的 QUBO 成本函数的设计。讨论扩展到在量子计算机辅助合成和实时编码性能中应用量子辅助模拟的含义。作品 \textit{Hexagonal Chambers}(Thomas 和 Itabora'i,2023)展示了艺术作品。
灾中和灾后沟通的五个关键推动因素
分类: 信号处理, 新兴技术, 信息论, 信息论
作者: Mohammad Shehab, Mustafa Kishk, Maurilio Matracia, Mehdi Bennis, Mohamed-Slim Alouini
发布时间: 2024-09-10
链接: http://arxiv.org/abs/2409.06822v1
摘要: 地震、洪水和军事冲突等灾难期间的民间通信对于拯救生命至关重要。然而,在这些情况下仍存在一些挑战,例如蜂窝通信和电力基础设施遭到破坏、缺乏视线 (LoS) 以及废墟下定位的困难。在本文中,我们讨论了可以在灾难期间促进通信的关键推动因素,即卫星和空中平台、冗余、静音以及无线能量传输 (WET) 辅助的可持续网络。文章还重点介绍了如何实施这些解决方案,以解决灾难期间的通信故障问题。最后,它揭示了尚未解决的挑战以及未来的研究方向。
“斗争是体验的一部分”:将不满情绪融入家庭膳食技术的设计中
分类: 人机交互, 计算机与社会, 新兴技术
作者: Yuxing Wu, Andrew D Miller, Chia-Fang Chung, Elizabeth Kaziunas
发布时间: 2024-09-10
链接: http://arxiv.org/abs/2409.06627v1
摘要: 膳食是家庭生活的核心(也是混乱的)部分。以前的进餐技术设计框架侧重于支持饮食需求或餐桌上的社交和庆祝互动。然而,家庭聚餐涉及许多活动的协调和复杂的家庭动态。在本文中,我们报告了对美国中西部 18 个家庭(包括伴侣/父母和孩子)的访谈和设计会议的结果,以揭示因家庭用餐体验而出现的重要家庭差异和紧张关系。借鉴女权主义理论,我们将养家糊口的工作视为一种照顾形式,引起人们对家庭用餐的社会和情感复杂性的关注。我们将我们的数据批判性地置于当前的设计叙述中,提出了生成性和系统性不满的敏感概念,作为一种有效的方式来困扰家庭与食物互动的设计空间,以应对日常家庭用餐体验中的挣扎。
自动驾驶汽车多模态大语言模型驱动场景测试
分类: 机器人技术, 人工智能, 新兴技术
作者: Qiujing Lu, Xuanhan Wang, Yiwei Jiang, Guangming Zhao, Mingyue Ma, Shuo Feng
发布时间: 2024-09-10
链接: http://arxiv.org/abs/2409.06450v1
摘要: 对于在道路部署之前有效测试自动驾驶汽车而言,极端情况的生成变得越来越重要。然而,现有的方法很难适应不同的测试要求,并且通常缺乏泛化到未见过的情况的能力,从而降低了生成场景的便利性和可用性。非常需要一种能够轻松控制场景生成的方法,以便在现实和具有挑战性的情况下进行高效的自动驾驶汽车(AV)测试。为了解决这个问题,我们提出了 OmniTester:一个基于多模式大语言模型 (LLM) 的框架,充分利用了 LLM 广泛的世界知识和推理能力。 OmniTester 旨在在模拟环境中生成真实且多样化的场景,为测试和评估 AV 提供强大的解决方案。除了快速工程之外,我们还使用城市交通模拟中的工具来简化大语言模型生成的代码的复杂性。此外,我们结合检索增强生成和自我改进机制来增强大语言模型对场景的理解,从而提高其生成更真实场景的能力。在实验中,我们展示了我们的方法在生成三种类型的具有挑战性和复杂场景时的可控性和现实性。此外,我们还展示了其在大语言模型泛化能力的推动下重建崩溃报告中描述的新场景的有效性。
内存计算的关键:RRAM 中矢量矩阵乘法的基准框架
分类: 分布式、并行和集群计算, 新兴技术, 系统与控制, 系统与控制
作者: Md Tawsif Rahman Chowdhury, Huynh Quang Nguyen Vo, Paritosh Ramanan, Murat Yildirim, Gozde Tutuncuoglu
发布时间: 2024-09-10
链接: http://arxiv.org/abs/2409.06140v1
摘要: 冯·诺依曼瓶颈是传统计算机体系结构中的一个基本挑战,它是由于连接处理和内存单元的共享总线而无法同时执行获取和数据操作而产生的。这一瓶颈显着限制了系统性能,增加了能耗,并加剧了计算复杂性。电阻随机存取存储器 (RRAM) 等新兴技术利用交叉阵列,通过模拟向量矩阵乘法 (VMM) 运算的内存计算来满足数据密集型计算任务的需求,提供了有前景的替代方案。然而,由于器件和电路级缺陷导致的错误传播仍然是一个重大挑战。在本研究中,我们介绍了 MELISO(内存中线性求解器),这是一个专为基于 RRAM 的系统量身定制的全面的端到端 VMM 基准测试框架。 MELISO 评估 VMM 操作中的错误传播,分析 RRAM 设备指标对错误幅度和分布的影响。本文介绍了 MELISO 框架,并展示了它在使用最先进的 RRAM 设备指标来表征和减轻 VMM 错误传播方面的实用性。
Beyond Diagonal RIS 和无人机在 6G NTN 中的集成:增强空中连接
分类: 信号处理, 新兴技术
作者: Wali Ullah Khan, Eva Lagunas, Asad Mahmood, Muhammad Asif, Manzoor Ahmed, Symeon Chatzinotas
发布时间: 2024-09-09
链接: http://arxiv.org/abs/2409.06073v1
摘要: 可重构智能表面(RIS)技术在第六代(6G)地面和非地面网络(NTN)中显示出巨大潜力,因为它可以有效地改变无线设置以改善连接性。人们对具有对角相位响应矩阵的传统 RIS 系统进行了广泛的研究。简单的 RIS 架构虽然具有成本效益,但在操作无线通道方面的能力受到限制。超对角线可重构智能表面 (BD-RIS) 通过利用互连的相位响应元件极大地改善了对无线环境的控制。这项工作提出在 6G NTN 中集成无人机 (UAV) 通信和 BD-RIS,有可能进一步增强无线覆盖范围和频谱效率。我们从无人机通信的基础知识开始,然后讨论 BD-RIS 技术的基础知识。随后,我们讨论了 BD-RIS 和无人机通信集成的潜力。然后,我们提出了一个基于无人机安装的传输 BD-RIS 通信的案例研究。最后,我们强调未来的研究方向并总结这项工作。
量子近似合成的窥孔优化
分类: 量子物理学, 新兴技术
作者: Joseph Clark, Himanshu Thapliyal
发布时间: 2024-09-09
链接: http://arxiv.org/abs/2409.06020v1
摘要: 量子电路的窥孔优化提供了一种利用标准电路合成方法进行可扩展量子电路优化的方法。该技术的一个应用是将整个电路划分为一系列窥视孔,并产生每个划分的子电路的多个近似值。然后选择每个子电路的单个近似值以形成优化的结果电路。我们对该架构的最后阶段提出了一系列改进,其中包括添加错误意识和更好的近似结果正确性的方法。我们使用 IBMQ FakeWashington 模拟器在一组基准电路上评估了这些建议的改进。结果表明,与 Qiskit 优化器相比,我们性能最佳的方法使总变分距离 (TVD) 和 Jensen-Shannon 散度 (JSD) 平均分别减少了 18.2% 和 15.8%。与现有解决方案相比,TVD 提高了 11.4%,JSD 提高了 9.0%。
量子强化学习 (QRL) 简介
分类: 量子物理学, 人工智能, 新兴技术, 机器学习, 神经和进化计算
作者: Samuel Yen-Chi Chen
发布时间: 2024-09-09
链接: http://arxiv.org/abs/2409.05846v1
摘要: 量子计算(QC)和机器学习(ML)的最新进展引发了人们对这两个前沿领域整合的极大兴趣。在各种机器学习技术中,强化学习 (RL) 因其解决复杂的顺序决策问题的能力而脱颖而出。强化学习已经在经典机器学习社区中取得了巨大的成功。现在,新兴的量子强化学习 (QRL) 领域寻求通过结合量子计算原理来增强 RL 算法。本文为更广泛的人工智能和机器学习社区介绍了这个令人兴奋的领域。
一种新颖的有限分数阶傅立叶变换及其在 Qudits 上的量子电路实现
分类: 量子物理学, 新兴技术, 信号处理, 高能物理 - 理论
作者: Emmanuel Floratos, Archimedes Pavlidis
发布时间: 2024-09-09
链接: http://arxiv.org/abs/2409.05759v1
摘要: 我们提出了离散分数傅里叶变换(DFrFT)的新数论定义。在这种方法中,DFrFT 被定义为算术旋转群 $SO_{2}[\mathbb{Z}N]$ 生成元的 $N \times N$ 维酉表示,它是 $\bmod 的有限集N$ 整数,$2\times 2$ 矩阵作用于离散环形相空间晶格 $\mathbb{Z}N \times \mathbb{Z}N$ 的点,保留欧几里德距离 $\bmod N$。我们使用有限量子力学 (FQM) 技术显式构造 $SO{2}[\mathbb{Z}{p^n}]$ 群的 $p^n$ 维酉矩阵表示,特别是我们详细计算出与发电机相对应的那个。这是我们对算术分数阶傅立叶变换 (AFrFT) 的定义。遵循这个定义,我们通过为具有二次相位的对角算子引入新颖的量子子电路,继续在 $n$ $p$ 维量子集(其中 $p$ 为素数)上构建 AFrFT 的高效量子电路作为乘以常数的新量子子电路。我们引入的量子子电路提供了一组能够为更一般的组(线性正则变换(LCT)组,环形的$SL{2}[\mathbb{Z}_N]$)构造量子电路的集合相空间晶格。作为副产品,给出了针对 qudit 和 qubit 情况的对角线和乘法器量子电路的扩展,这些扩展在各种应用中单独有用。此外,我们分析了高效 AFrFT 量子电路的深度、宽度和门复杂度,并估计其门复杂度为 $O(n^2)$ 量级,其深度为 $O(n)$ 量级深度为 $n$,同时它具有允许 qudits 之间进行局部交互的结构。
RegNLP 实践:通过自动信息检索和答案生成促进合规性
分类: 计算和语言, 人工智能, 计算工程、金融和科学, 新兴技术, 信息检索
作者: Tuba Gokhan, Kexin Wang, Iryna Gurevych, Ted Briscoe
发布时间: 2024-09-09
链接: http://arxiv.org/abs/2409.05677v1
摘要: 由政府监管机构发布的监管文件制定了组织必须遵守的规则、指南和标准,以确保法律合规性。这些文件的特点是长度、复杂性和频繁更新,解释起来具有挑战性,需要组织投入大量时间和专业知识以确保持续合规。监管自然语言处理 (RegNLP) 是一个多学科子领域,旨在简化访问监管规则和义务的理解和解释。我们为 RegNLP 定义自动问题段落生成任务,创建包含来自阿布扎比全球市场 (ADGM) 金融监管文件集合的 27,869 个问题的 ObliQA 数据集,设计基线监管信息检索和答案生成系统,并使用 RePAS 对其进行评估,一种新颖的评估指标,用于测试生成的答案是否准确捕获所有相关义务并避免矛盾。
用于状态准备的量子多路复用器简化
分类: 量子物理学, 新兴技术
作者: José A. de Carvalho, Carlos A. Batista, Tiago M. L. de Veras, Israel F. Araujo, Adenilton J. da Silva
发布时间: 2024-09-09
链接: http://arxiv.org/abs/2409.05618v1
摘要: 量子态的初始化或量子态准备(QSP)是量子算法中的基本子程序。在最坏的情况下,通用 QSP 算法由于构建它们需要应用多控制门而非常昂贵。在这里,我们提出了一种算法,可以检测给定的量子态是否可以分解为子状态,从而在我们以某种程度的解开来初始化状态时提高编译 QSP 电路的效率。通过消除量子多路复用器的控制来实现简化,显着减少电路深度和 CNOT 门的数量,并且比以前的 QSP 算法具有更好的执行和编译时间。考虑到 CNOT 门的深度和数量方面的效率,我们的方法与文献中的方法具有竞争力。然而,当谈到运行时和编译效率时,我们的结果明显更好,并且实验表明,通过增加量子位的数量,方法的时间效率之间的差距会增加。
DFabric:使用 CXL 以太网混合互连横向扩展数据并行应用程序
分类: 分布式、并行和集群计算, 硬件架构, 新兴技术
作者: Xu Zhang, Ke Liu, Yisong Chang, Hui Yuan, Xiaolong Zheng, Ke Zhang, Mingyu Chen
发布时间: 2024-09-09
链接: http://arxiv.org/abs/2409.05404v1
摘要: CXL 和 NVLink 等新兴互连已集成到主机内拓扑中,以扩展更多加速器并促进它们(例如 GPU)之间的高效通信。为了跟上加速器不断增长的计算吞吐量,互连的链路带宽得到了大幅增强,例如,CXL 3.0 链路达到 256GBps,比以太网和 InfiniBand 网络链路高出一个数量级或更多。因此,当数据密集型作业(例如 LLM 培训)在多个主机上扩展超出互连的范围限制时,网络基础设施的带宽限制会严重阻碍性能。我们通过提出 DFabric(一种两层互连架构)来解决这个问题。我们通过提出 DFabric(一种两层互连架构)来解决这个问题。首先,DFabric通过互连结构(即CXL结构)分解机架的计算单元,该结构可在机架级扩展,以便它们可以享受机架内的高效互连。其次,DFabric 将 NIC 从主机中分离出来,并将它们合并以使用 CXL 结构形成 NIC 池。通过提供与互连带宽相当的足够聚合容量,NIC 池可跨机架或超出互连结构的可达限制桥接高效通信。然而,本地内存访问成为每个主机有效利用NIC池的瓶颈。最后,DFabric通过分解主机本地内存并添加更多内存设备来构建一个具有足够带宽的内存池。我们已经实现了可以透明地运行应用程序的 DFabric 原型。我们通过运行各种微基准测试和计算密集型应用程序(例如 DNN 和图形)来验证其性能增益。
从概念到现实:5G 定位以及 OpenAirInterface 中 UL-TDoA 的开源实现
分类: 信息论, 新兴技术, 表现, 信息论
作者: Adeel Malik, Mohsen Ahadi, Florian Kaltenberger, Klaus Warnke, Nguyen Tien Thinh, Nada Bouknana, Cedric Thienot, Godswill Onche, Sagar Arora
发布时间: 2024-09-08
链接: http://arxiv.org/abs/2409.05217v1
摘要: 本文首次提出使用 OpenAirInterface (OAI) 框架的 3GPP 上行链路到达时间差 (UL-TDoA) 定位方法的开源实现。 UL-TDoA 是 5G 网络中的一项关键定位技术,利用信号到达多个基站的时间差来确定用户设备 (UE) 的精确位置。该实施旨在通过将 UL-TDoA 功能集成到 OAI 的无线接入网络 (RAN) 和核心网络 (CN) 组件中,实现先进定位技术的民主化,提供全面且符合 3GPP 标准的解决方案。开发包括合并 3GPP 标准定义的基本协议程序、消息流和接口。验证使用两种不同的方法进行:用于受控测试的基于 OAI-RF 模拟器的设置和 EURECOM 在现实条件下基于 O-RAN 的本地化测试台。结果证明了这种开源 UL-TDoA 实施的可行性,可在各种环境中实现精确定位。通过公开这一实施,该研究为 5G 定位技术领域的广泛研究、开发和创新铺平了道路,促进协作并加速蜂窝网络定位的进步。
调查文化价值观在软件工程采用大型语言模型中的作用
分类: 软件工程, 新兴技术
作者: Stefano Lambiase, Gemma Catolino, Fabio Palomba, Filomena Ferrucci, Daniel Russo
发布时间: 2024-09-08
链接: http://arxiv.org/abs/2409.05055v1
摘要: 作为一种社会技术活动,软件开发涉及人与技术的紧密互连。将大型语言模型 (LLM) 集成到此过程中体现了软件开发的社会技术性质。尽管大语言模型会影响开发过程,但软件开发从根本上仍然以人为中心,因此有必要对这种采用中的人为因素进行调查。因此,通过这项研究,我们探讨了影响软件开发中采用大语言模型的因素,重点关注专业人员文化价值观的作用。在技术接受和使用统一理论 (UTAUT2) 和霍夫斯泰德文化维度的指导下,我们假设文化价值观调节 UTAUT2 框架内的关系。使用偏最小二乘结构方程模型和 188 位软件工程师的数据,我们发现习惯和绩效预期是 LLM 采用的主要驱动因素,而文化价值观并没有显着调节这一过程。这些发现表明,通过强调大语言模型如何提高绩效和效率,组织可以鼓励其使用,无论文化差异如何。实际步骤包括提供培训计划来展示大语言模型的好处,为定期使用创造支持性环境,以及持续跟踪和分享使用大语言模型的绩效改进。
时钟跟随数据的延迟平衡:优化鲁棒快速单通量量子电路的区域延迟权衡
分类: 新兴技术
作者: Robert S. Aviles, Phalgun G K, Peter A. Beerel
发布时间: 2024-09-08
链接: http://arxiv.org/abs/2409.04944v1
摘要: 本文提出了一种用于合成时钟跟随数据设计的算法,该算法为 RSFQ 电路提供针对时序违规的鲁棒性,同时保持高性能并最大限度地降低面积成本。由于超导逻辑门必须计时,因此管理数据流是一个具有挑战性的问题,通常需要插入许多路径平衡 D 翻转 (DFF) 来正确排序数据,从而导致面积大幅增加。为了应对这一挑战,我们提出了一种将 DFF 插入时钟跟随数据 RSFQ 电路的算法,该算法部分平衡电路内的延迟,以实现目标吞吐量,同时最小化面积。我们的算法可以考虑预期的时序变化,并且通过调整时钟网络和时钟频率的偏差,我们可以减轻制造后意外的时序违规。通过具有标称延迟的基准套件来量化我们的方法的优势,我们的设计与高频全路径平衡 (FPB) 设计相比,面积延迟积 (ADP) 平均提高了 1.48 倍,而 ADP 比高频全路径平衡 (FPB) 设计平均提高了 2.07 倍。由最先进的 (SOTA) 多相时钟解决方案提供的最先进的稳健电路。
3D芯片技术是性能提升的下一个增长引擎吗?
分类: 新兴技术
作者: Philip Emma, Eren Kurshan
发布时间: 2024-09-06
链接: http://arxiv.org/abs/2409.14527v1
摘要: 半导体行业正在实现多种发展趋势的令人着迷的融合,这可能会导致计算机系统的设计、实现、扩展和使用方式发生许多革命性的变化。由于摩尔定律在过去几十年中推动了系统的发展,它即将接近真正的、严格的限制,因此创建 3D、3D 设备堆栈的能力似乎很有前途,可以作为一种继续将更多设备集成到系统中的方法。一方面,这种制造 3D 技术的新生能力可以被解释为仅仅是摩尔定律的延伸,另一方面,系统现在可以跨多个平面集成的事实带来了一些新的机会,以及严峻的挑战和问题。在本文中,我们探讨了这些不同的挑战和机遇,并讨论了 3D 技术可能促进的结构和系统。我们还描述了这些系统可能发生变化的方式。由于 3D 技术提供了一些不同的价值主张,我们预计 3D 技术可能影响我们未来系统设计、实现和使用方法的一些最重要方式对于大多数系统设计人员来说尚不明显,我们概述了以下几个方面:他们。
3D 系统设计:在 3D 中构建定制模块化系统的案例
分类: 分布式、并行和集群计算, 新兴技术
作者: Philip Emma, Eren Kurshan
发布时间: 2024-09-06
链接: http://arxiv.org/abs/2409.09068v1
摘要: 3D 有望通过聚合芯片来构建系统的新维度。字面上地。虽然最常见的用途仍然与其作为包装技术的早期形式紧密相关,但新的应用领域已经出现。随着底层技术的不断发展,3D 的独特优势对更广泛的应用程序越来越有吸引力:从嵌入式移动应用程序到服务器和内存系统。在本文中,我们重点关注 3D 技术的系统级影响,试图区分它为不同细分市场和应用提供的独特优势。
Parallax:硬件约束下的中性原子量子计算机编译器
分类: 量子物理学, 硬件架构, 新兴技术
作者: Jason Ludmir, Tirthak Patel
发布时间: 2024-09-06
链接: http://arxiv.org/abs/2409.04578v1
摘要: 在不同的量子计算技术中,中性原子量子计算机具有多种优势特征,例如多量子位门、特定应用拓扑、可移动量子位、同质量子位和长程相互作用。然而,现有的中性原子编译技术无法以实用且可扩展的方式利用这些优势。本文介绍了Parallax,一种为中性原子系统量身定制的零SWAP、可扩展、可并行的编译和原子移动调度方法,与状态-原子系统相比,它减少了25%的高错误操作,平均提高了28%的成功率。最先进的技术。
快速适应基于深度学习的无线通信
分类: 网络和互联网架构, 新兴技术, 信号处理
作者: Ouya Wang, Hengtao He, Shenglong Zhou, Zhi Ding, Shi Jin, Khaled B. Letaief, Geoffrey Ye Li
发布时间: 2024-09-06
链接: http://arxiv.org/abs/2409.04302v1
摘要: 与人工智能(AI)的集成被认为是下一代无线通信的六种使用场景之一。然而,一些关键挑战阻碍了深度学习(DL)技术在无线通信中的广泛应用。特别是,现有的基于深度学习的无线通信很难适应快速变化的无线环境。在本文中,我们讨论通过使用少样本学习(FSL)技术来快速适应基于深度学习的无线通信。我们首先通过强调无线通信的两种不同的 FSL 设计要求来确定无线通信快速适应与传统人工智能任务之间的差异。为了建立一个广阔的视角,我们对无线通信中满足这两个设计要求的现有 FSL 技术进行了全面的回顾。我们特别强调应用领域知识在实现快速适应方面的重要性。我们特别关注多用户多输入多输出(MU-MIMO)预编码作为示例,以展示 FSL 在无线通信中实现快速自适应的优势。最后,我们重点介绍了几个开放研究问题,以实现未来在无线通信应用中广泛部署快速自适应深度学习。
非方系数矩阵线性系统的量子多行迭代算法
分类: 量子物理学, 新兴技术
作者: Weitao Lin, Guojing Tian, Xiaoming Sun
发布时间: 2024-09-06
链接: http://arxiv.org/abs/2409.04010v2
摘要: 在量子线性系统算法领域,量子计算相对于经典计算实现了指数级的计算优势。然而,焦点一直集中在方系数矩阵上,很少有量子算法处理非方矩阵。针对 $ Ax = b $ where $ A $$ \in\mathbb{R}^{m \times n} $ 定义的此类问题,我们提出了一种受经典多行迭代方法启发的量子算法,并提供了基于量子比较器和量子随机存取存储器(QRAM)的显式量子电路。我们的量子多行迭代算法的时间复杂度为$O(K \log m)$,其中$K$表示迭代步数,与经典版本相比,这表现出指数级的加速。基于经典多行迭代算法的收敛性,我们证明我们的量子算法比[Phys.修订版 A, 101, 022322 (2020)]。此外,我们的算法对系数矩阵的要求较少,使其适合解决不一致系统和二次优化问题。
开源可微光刻成像框架
分类: 应用物理, 新兴技术
作者: Guojin Chen, Hao Geng, Bei Yu, David Z. Pan
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.15306v1
摘要: 在摩尔定律和集成电路激增的推动下,电子行业快速发展,带来了现代社会的重大进步,包括互联网、无线通信和人工智能 (AI)。这一进展的核心是光学光刻技术,这是半导体制造中的一项关键技术,约占生产成本的 30% 至 40%。随着半导体节点的缩小和晶体管数量的增加,光学光刻在当前的集成电路(IC)制造技术中变得越来越重要。本文介绍了一种开源可微分光刻成像框架,该框架利用可微分编程的原理和 GPU 的计算能力来提高光刻建模的精度并简化分辨率增强技术(RET)的优化。该框架将光刻的核心组件建模为可微分段,允许实现标准标量成像模型,包括阿贝和霍普金斯模型及其近似模型。该论文介绍了一种计算光刻框架,该框架使用先进的计算技术和可微分编程来优化半导体制造工艺。它比较成像模型并提供增强分辨率的工具,展示改进的半导体图案性能。该开源框架代表了光刻技术的重大进步,促进了该领域的合作。源代码可在 https://github.com/TorchOPC/TorchLitho 获取
qSAT:用于硬件等效性检查的高效量子可满足性求解器的设计
分类: 量子物理学, 新兴技术
作者: Abhoy Kole, Mohammed E. Djeridane, Lennart Weingarten, Kamalika Datta, Rolf Drechsler
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.03917v1
摘要: 使用布尔可满足性 (SAT) 求解器进行硬件验证在某些情况下会导致运行时间呈指数增长。在这项工作中,我们提出了一种高效的量子 SAT (qSAT) 求解器,用于采用 Grover 算法对布尔电路进行等价检查。基于积独和的生成合取范式等价子句需要更少的量子位,并最小化量子电路解释的门和深度。还作为案例研究介绍了影响 Grover 迭代和量子资源的验证参考电路的考虑。实验结果评估了使用开源 Qiskit 平台和 IBM 量子计算机所提出的验证方法的优势。
用于 125 km 20 Gbps PAM4 信号色散补偿的硅光子神经网络及其高达 100 Gbps 的可扩展性
分类: 新兴技术, 应用物理, 光学
作者: Emiliano Staffoli, Gianpietro Maddinelli, Lorenzo Pavesi
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.03547v1
摘要: 测试前馈光子神经网络 (PNN),以实现强度调制/直接检测光链路中的色散补偿。 PNN 基于一系列线性和非线性变换。线性级由在绝缘体上硅平台上实现的 8 抽头延时复杂感知器构成,并充当可调光学滤波器。非线性级由施加在末端光电探测器上的电场的平方模量提供。训练最大化光学水平之间的分离(即眼图孔径),从而降低误码率。实验证明了 20 Gbps 4 级脉冲幅度调制信号的有效均衡效果可达 125 公里。对进化算法和基于梯度的方法进行训练测试,然后在可重复性和收敛时间方面进行比较。根据光纤的理论传递函数解释训练产生的最佳权重。最后,模拟研究证明了该布局可扩展到更大的带宽(高达 100 Gbps)。
基于 LLM 的事件抽象和 IoT 源日志集成
分类: 数据库, 新兴技术, 机器学习, 68M14, I.2.1; H.4.0
作者: Mohsen Shirali, Mohammadreza Fani Sani, Zahra Ahmadi, Estefania Serral
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.03478v1
摘要: 物联网 (IoT) 设备收集的持续数据流彻底改变了我们通过各种应用了解世界并与之交互的能力。然而,在开始分析之前,必须准备好这些数据并将其转换为事件数据。在本文中,我们阐明了在事件抽象和集成中利用大型语言模型 (LLM) 的潜力。我们的方法旨在根据原始传感器读数创建事件记录,并将来自多个物联网源的日志合并到适合进一步流程挖掘应用程序的单个事件日志中。我们考虑了老年护理和纵向健康监测中物联网应用的案例研究,展示了大语言模型在事件抽象方面的能力。结果显示,检测高级活动的平均准确度为 90%。这些结果凸显了大语言模型在解决事件抽象和集成挑战方面的巨大潜力,有效缩小了现有差距。
高效点云传输的语义通信
分类: 新兴技术
作者: Shangzhuo Xie, Qianqian Yang, Yuyi Sun, Tianxiao Han, Zhaohui Yang, Zhiguo Shi
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.03319v1
摘要: 随着激光雷达相机等三维采集技术的进步,高效传输 3D 点云的需求变得越来越重要。在本文中,我们提出了一种新颖的语义通信(SemCom)方法,用于高效的 3D 点云传输。与依赖下采样和特征提取进行压缩的现有方法不同,我们的方法利用并行结构从点云中分别提取全局和局部信息。该系统由五个关键组件组成:局部语义编码器、全局语义编码器、通道编码器、通道解码器和语义解码器。我们的数值结果表明,这种方法在重建质量方面超越了传统的八叉树压缩方法和基于深度学习的替代策略。此外,我们的系统能够在不利的信道条件下实现高质量的点云重建,特别是即使在严重的信道噪声下也能保持超过37dB的重建质量。
基于忆阻器的计算和综合
分类: 系统与控制, 新兴技术, 系统与控制
作者: Prashant Gupta, Priscilla Jennifer
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.03227v1
摘要: 忆阻器于 1971 年被 Leon Chua 博士确定为第四种基本电路元件,此后它因其非易失性而引起了广泛的关注,并被认为是超越 CMOS 时代计算的可行解决方案。最近,忆阻器已被用于执行 AND、OR、NAND、NOR、XOR 等基本逻辑运算,并且还用于点积引擎、卷积神经网络等应用。本文提出了一种新的忆阻器行为模型,然后使用它构建了一个 32 位纹波进位加法器。该论文随后将使用忆阻器的 32 位纹波进位加法器与 45nm CMOS 技术的面积、功耗和时间延迟进行了比较,并强调了其优点和缺陷。
大语言模型的内容审核:从准确性到合法性
分类: 计算机与社会, 人工智能, 新兴技术, 人机交互, 机器学习
作者: Tao Huang
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.03219v1
摘要: LLM(大语言模型)的一种趋势应用是将其用于在线平台中的内容审核。目前关于该应用程序的大多数研究都集中在准确性指标上,即大语言模型对内容做出正确决策的程度。本文认为准确性是不够的并且具有误导性,因为它没有掌握简单情况和困难情况之间的区别,以及在实现更高准确性时不可避免的权衡。仔细考察就会发现,内容审核是平台治理的一个组成部分,其关键是获得和增强合法性。大语言模型的主要目标不是使审核决策正确,而是使其合法化。在这方面,本文提出了从单一准确性基准到基于合法性的评估 LLM 主持人绩效框架的范式转变。该框架建议,对于简单的案例,关键是确保准确性、速度和透明度,而对于困难的案例,重要的是合理的理由和用户参与。在此框架下进行检验,LLM 的真正潜力并不是准确性的提高。相反,LLM可以在其他四个方面做出更好的贡献:从简单案例中筛选困难案例,为审核决策提供高质量的解释,帮助人类审稿人获得更多上下文信息,并以更具互动性的方式促进用户参与。本文利用法律和社会科学的规范理论来批判性地评估新技术的应用,试图重新定义大语言模型在内容审核中的作用,并重新引导该领域的相关研究。
DasAtom:量子电路改造的分而穿梭原子方法
分类: 量子物理学, 新兴技术
作者: Yunqi Huang, Dingchao Gao, Shenggang Ying, Sanjiang Li
发布时间: 2024-09-05
链接: http://arxiv.org/abs/2409.03185v1
摘要: 中性原子 (NA) 量子系统正在成为量子计算的领先平台,与超导电路和离子陷阱相比,可提供卓越或有竞争力的量子位计数和门保真度。然而,NA 设备的独特功能,例如长距离相互作用、长量子位相干时间以及物理移动量子位的能力,给量子电路编译带来了明显的挑战。在本文中,我们介绍了 DasAtom,这是一种新颖的分频穿梭原子方法,旨在利用这些功能来优化 NA 设备的量子电路转换。 DasAtom 将电路划分为子电路,每个子电路都与一个量子位映射相关联,允许直接执行子电路内的所有门。然后,该算法使原子从一个映射无缝过渡到下一个映射,从而提高执行效率和整体保真度。对于 30 量子位量子傅里叶变换 (QFT),DasAtom 的保真度比基于移动的算法 Enola 提高了 414 倍,比基于 SWAP 的算法 Tetris 提高了 10.6 倍。值得注意的是,这种改进预计将随着量子比特数量呈指数级增长,从而将 DasAtom 定位为在 NA 平台上扩展量子计算的非常有前途的解决方案。
使用单个片上非线性声波器件的频域并行计算
分类: 应用物理, 新兴技术
作者: Jun Ji, Zichen Xi, Bernadeta R. Srijanto, Ivan I. Kravchenko, Ming Jin, Wenjie Xiong, Linbo Shao
发布时间: 2024-09-04
链接: http://arxiv.org/abs/2409.02689v1
摘要: 乘法累加 (MAC) 是信号处理、数值模拟和机器学习中的关键计算操作。这项工作提出了一种利用千兆赫 (GHz) 频率声波非线性的可扩展、可编程、频域并行计算。通过在频域中对数据进行编码,单个非线性声波器件可以同时执行十亿次算术运算。铌酸锂 (LN) 上占地面积为 0.03 mm$^2$ 的单个器件可实现每秒 0.0144 万亿次浮点运算 (TFLOPS),从而实现 0.48 TFLOPS/mm$^2$ 的计算面积密度和一个核心功率效率为 0.14 TFLOPS/瓦。作为应用,我们演示了两个 16 x 16 矩阵的乘法以及 128 x 128 像素照片的卷积成像处理。我们的技术可以在近传感器信号处理和边缘计算领域找到多种应用。
提升5G性能:缩短服务时间和6G标准研究方向
分类: 网络和互联网架构, 新兴技术
作者: Laura Landon, Vipindev Adat Vasudevan, Jaeweon Kim, Junmo Sung, Jeffery Tony Masters, Muriel Médard
发布时间: 2024-09-04
链接: http://arxiv.org/abs/2409.02788v1
摘要: 本文提出了几种在使用 5G 及更高技术的网络中最大限度地缩短数据包服务时间的方法。我们建议利用网络编码和混合自动重复请求 (HARQ) 来减少服务时间,并根据服务时间优化调制和编码方案 (MCS) 选择。我们的网络编码方法包括增加传输中的数据包数量的方法,遵守 16 个 HARQ 进程限制的当前标准,证明这些策略可以提高吞吐量并减少延迟。实验结果表明,在低 SNR 情况下,网络编码可将服务时间减少多达 7%,并且随着传输中数据包数量的增加,所有 SNR 的减少幅度更大,这表明未来 6G 标准应考虑增加 HARQ 进程的数量以获得更好的性能。
SoK:比特币第二层(L2)
分类: 密码学和安全, 新兴技术
作者: Minfeng Qi, Qin Wang, Zhipeng Wang, Manvir Schneider, Tianqing Zhu, Shiping Chen, William Knottenbelt, Thomas Hardjono
发布时间: 2024-09-04
链接: http://arxiv.org/abs/2409.02650v1
摘要: 我们提出了第一个关于构建比特币第二层 (L2) 解决方案的知识系统化 (SoK)。我们仔细检查了正在进行的比特币 L2 解决方案的代表性子集(335 个广泛调查的案例中的 40 个),并通过两种方法(即修改交易和创建证明)对六种经典设计模式进行了简洁而有效的识别。值得注意的是,我们是第一个采用铭文技术(于 2023 年中期出现)以及一系列相关创新的公司。我们进一步建立了一个参考框架,作为非常适合评估比特币 L2 解决方案安全方面的基准标准,并且也可以扩展到更广泛的 L2 应用。我们应用这个框架来评估我们调查的每个项目。我们发现基于铭文的方法为比特币系统引入了新功能(即可编程性),而现有的基于证明的解决方案主要解决可扩展性挑战。我们的安全分析揭示了针对数据/状态(可用性、验证)、资产(撤回、恢复)和用户(争议、审查)的新攻击向量。
神经形态心率监测器:用于单调变化检测的神经状态机
分类: 新兴技术
作者: Alessio Carpegna, Chiara De Luca, Federico Emanuele Pozzi, Alessandro Savino, Stefano Di Carlo, Giacomo Indiveri, Elisa Donati
发布时间: 2024-09-04
链接: http://arxiv.org/abs/2409.02618v1
摘要: 检测心率 (HR) 的单调变化对于早期识别心脏状况和健康管理至关重要。这对于痴呆症患者尤其重要,因为心率趋势可以表明压力或躁动。开发能够对心率进行持续监控的可穿戴技术对于有效检测长时间内的缓慢变化至关重要。然而,设计能够连续监测和处理生物信号并能够在低功耗状态下运行以确保持久性能的紧凑电子电路仍然是一个开放的挑战。神经形态技术为实时健康监测提供了一种节能的解决方案。我们提出了神经状态机(NSM)网络的神经形态实现,以编码不同的健康状态并根据输入刺激在它们之间进行切换。我们的重点是检测心电图数据中的单调状态切换,以识别心率的渐进增加。这种创新方法有望在持续健康监测和管理方面取得重大进步。
通过基于规则的人工智能和大型语言模型推进网络事件时间线分析
分类: 密码学和安全, 人工智能, 新兴技术, 机器学习
作者: Fatma Yasmine Loumachi, Mohamed Chahine Ghanem
发布时间: 2024-09-04
链接: http://arxiv.org/abs/2409.02572v1
摘要: 时间线分析 (TA) 是数字取证 (DF) 中时间线取证 (TF) 的关键部分,主要侧重于检查和分析从事件日志、文件元数据和其他相关数据派生的时间数字工件(例如时间戳)以关联事件网络事件造成的结果并重建其时间顺序。传统工具通常难以有效处理 DF 调查和事件响应 (IR) 过程中获取的大量和各种数据。本文提出了一种新颖的框架 GenDFIR,它将基于规则的人工智能 (R-BAI) 算法与大型语言模型 (LLM) 相结合,以推进和自动化 TA 流程。我们的方法包括两个主要阶段 (1) 我们使用 R-BAI 根据预定义的规则识别和选择异常数字文物。 (2) 然后,在检索增强生成 (RAG) 代理的帮助下,将选定的工件转换为嵌入,供 LLM 进行处理。因此,大语言模型利用其能力对文物执行自动化 TA 并预测潜在的事件场景。为了验证我们的框架,我们使用跨综合网络事件模拟场景的各种指标来评估 GenDFIR 性能、效率和可靠性。本文提出了概念验证,其中的研究结果证明了将 R-BAI 和大语言模型结合起来进行助教的巨大潜力。这种新颖的方法凸显了生成式人工智能(GenAI)(特别是大语言模型)的力量,并为高级威胁检测和事件重建开辟了新途径,代表着该领域向前迈出了重要一步。
用于部署边缘计算神经形态硬件的磁隧道结设计
分类: 应用物理, 新兴技术
作者: Davi Rodrigues, Eleonora Raimondo, Riccardo Tomasello, Mario Carpentieri, Giovanni Finocchio
发布时间: 2024-09-04
链接: http://arxiv.org/abs/2409.02528v1
摘要: 强大且可扩展的磁隧道结(MTJ)的电可读复杂动态为推进神经形态计算提供了有希望的机会。在这项工作中,我们提出了一种具有自由层和两个偏振器的 MTJ 设计,能够在设备级别计算 S 型激活函数及其梯度。这种设计可以在单个设备中实现前馈和反向传播计算,通过引入直接在硬件中执行反向传播的能力来扩展先前在文献中探索的神经形态计算框架。我们的算法实现揭示了两个关键发现:(i) MTJ 生成的曲线和准确的软件生成的曲线之间的微小差异对反向传播算法的性能影响可以忽略不计,(ii) 设备实现对于内部计算具有高度鲁棒性。 -设备变化和噪声,以及(iii)所提出的方法有效支持迁移学习和知识蒸馏。为了证明这一点,我们使用通过我们的 MTJ 设计实现的软件训练模型的权重来评估边缘计算网络的性能。结果显示,与原始软件实现相比,Fashion MNIST 数据集的准确度损失最小,仅为 0.1%,CIFAR-100 数据集的准确度损失最小为 2%。这些结果凸显了我们的 MTJ 设计在边缘计算应用中紧凑的基于硬件的神经网络的潜力,特别是在迁移学习方面。
FrameCorr:自适应、基于自动编码器的神经压缩,用于资源和时序受限网络设置中的视频重建
分类: 图像和视频处理, 计算机视觉和模式识别, 新兴技术, 多媒体
作者: John Li, Shehab Sarar Ahmed, Deepak Nair
发布时间: 2024-09-04
链接: http://arxiv.org/abs/2409.02453v1
摘要: 尽管由于物联网 (IoT) 设备的成本效益而越来越多地采用视频处理,但由于不同的时间限制和网络带宽的稀缺,将捕获的数据传输到附近的服务器仍面临挑战。当提供不完整的数据时,现有的视频压缩方法在恢复压缩数据方面面临困难。在这里,我们介绍 \emph{\project},这是一种基于深度学习的解决方案,它利用先前接收到的数据来预测帧的缺失片段,从而能够根据部分接收的数据重建帧。
下一代路由系统的三大支柱
分类: 网络和互联网架构, 新兴技术, 机器学习
作者: Lei Li, Mengxuan Zhang, Zizhuo Xu, Yehong Xu, XIaofang Zhou
发布时间: 2024-09-03
链接: http://arxiv.org/abs/2409.11412v1
摘要: 路线结果在运输效率方面发挥着越来越重要的作用,但它们可能会无意中造成交通拥堵。这是因为在当前的路由范例中,交通状况和路由系统是分离的组件。在本文中,我们提出了一种下一代路由范例,可以通过实时考虑路由结果的影响来减少交通拥堵。具体来说,我们将路由结果视为未来交通流的根本原因,同时将其识别为交通状况的根本原因。为了实现这样一个系统,我们确定了三个基本组成部分:1)交通状况模拟,以保证准确性的方式建立交通流和交通状况之间的关系; 2)未来的航线管理,支持动态航线更新的高效模拟; 3)全球路径优化,提高整体运输系统效率。将介绍初步设计和实验结果,并讨论相应的挑战和研究方向。
SELCC:计算有限的分解内存上的一致性缓存
分类: 数据库, 分布式、并行和集群计算, 新兴技术
作者: Ruihong Wang, Jianguo Wang, Walid G. Aref
发布时间: 2024-09-03
链接: http://arxiv.org/abs/2409.02088v2
摘要: 将内存与计算分离提供了更好地利用数据中心中的闲置内存的机会。在计算节点中缓存数据并维持多个计算节点之间的缓存一致性非常重要,以节省分解内存和计算节点之间的往返通信成本。然而,分解内存服务器上有限的计算能力使得在分解共享内存上维持多个计算端缓存之间的缓存一致性具有挑战性。本文介绍了SELCC;共享独占锁存器缓存一致性协议,可保持缓存一致性,而不会给远程内存端带来任何计算负担。 SELCC建立在单侧共享独占锁存协议的基础上,通过在计算节点之间引入惰性锁存释放和失效消息,从而保证数据访问原子性和缓存一致性。 SELCC 通过将当前缓存副本持有者 ID 嵌入到 RDMA 锁存字中来最大限度地减少通信往返次数,并将本地并发控制优先于全局并发控制。我们将 SELCC 协议实例化到计算端缓存上,在分解内存上形成一个抽象层。该抽象层为上层应用程序提供类似主存的 API,从而使现有的数据结构和算法能够以最少的代码更改在分解的内存上运行。为了演示 SELCC 的可用性,我们通过 SELCC 的 API 实现了 B 树和三种事务并发控制算法。微基准测试结果表明,与基于 RPC 的缓存一致性协议相比,SELCC 协议实现了更好的性能。此外,YCSB 和 TPC-C 基准测试表明,SELCC 上的应用程序可以通过分解内存实现与竞争对手相当或更好的性能。
具有哈密顿感知优化的三元树费米子到量子位映射
分类: 量子物理学, 新兴技术
作者: Yuhao Liu, Kevin Yao, Jonathan Hong, Julien Froustey, Yunong Shi, Ermal Rrapaj, Costin Iancu, Gushu Li
发布时间: 2024-09-03
链接: http://arxiv.org/abs/2409.02010v1
摘要: 本文介绍了哈密顿感知三元树 (HATT) 框架,为特定费米子哈密顿量编译优化的费米子到量子位映射。在费米子量子系统的模拟中,高效的费米子到量子位映射在将费米子系统转变为量子位系统方面发挥着关键作用。 HATT 利用三元树映射和自下而上的构造过程来生成哈密顿感知的费米子到量子位的映射,以减少量子位哈密顿量的泡利权重,从而降低量子模拟电路开销。此外,我们的优化保留了费米子到量子位映射中重要的真空状态保存属性,并将算法的复杂性从 $O(N^4)$ 降低到 $O(N^3)$。对各种费米子系统的评估和模拟表明,泡利重量和电路复杂性均显着降低,同时对大型系统具有出色的可扩展性。 Ionq 量子计算机上的实验也显示了我们的方法在量子模拟中抗噪声方面的优势。
集体智慧的 DAO?揭示去中心化自治组织中区块链治理的复杂性
分类: 计算机与社会, 新兴技术, 应用物理, 物理与社会
作者: Mark C. Ballandies, Dino Carpentras, Evangelos Pournaras
发布时间: 2024-09-03
链接: http://arxiv.org/abs/2409.01823v1
摘要: 去中心化自治组织(DAO)利用区块链和加密经济学,从传统的等级控制转向去中心化方法,从而改变了组织结构。尽管管理着大量资金并建立了全球网络,但 DAO 仍面临着参与度下降、中心化程度提高以及无法适应不断变化的环境等挑战,从而抑制了创新。本文将 DAO 作为复杂系统进行探索,并应用复杂性科学来解释其低效率。我们特别讨论了 DAO 挑战及其复杂性,并介绍了集体智慧、数字民主和适应的自组织机制。通过应用这些机制来改进 DAO 的设计和构建,创建了一个实用的 DAO 设计框架。这一贡献为复杂性科学和 DAO 交叉领域的未来研究奠定了基础。
用于环境修复的声悬浮:石油泄漏遏制和预测的有效方法
分类: 新兴技术
作者: L Rochit, Nithish Kumar N, Devi Priya V S, Sibi Chakkaravarthy Sethuraman, Anitha Subramanian
发布时间: 2024-09-03
链接: http://arxiv.org/abs/2409.01642v1
摘要: 大规模石油泄漏、塑料垃圾和化学污染严重影响海洋生态,破坏生态系统,危及海洋生物。认识到石油泄漏对生态系统的不利影响,我们的研究旨在为减少其影响的创造性方法奠定基础。这项研究的重点是石油泄漏的遏制和预测,探讨了声悬浮作为环境清理尖端技术的潜力。在不造成额外生态危害的情况下有效分离和消除污染物是传统溢油清理技术的主要问题。声悬浮提供了一种非侵入性、准确且有效的替代方案,通过使用声波在受控环境中精确而巧妙地将油滴与水分离。这种提议的方法可以减少对环境的负面影响并提高清理工作的效率。通过油滴概念验证实验对研究结果进行了检查和评估,确定了超声波压力强度与收集到的油滴比例之间的关系。
SafeEmbodAI:嵌入式人工智能系统中移动机器人的安全框架
分类: 机器人技术, 人工智能, 新兴技术
作者: Wenxiao Zhang, Xiangrui Kong, Thomas Braunl, Jin B. Hong
发布时间: 2024-09-03
链接: http://arxiv.org/abs/2409.01630v1
摘要: 实体人工智能系统,包括与物理世界自主交互的人工智能机器人,将通过大型语言模型(LLM)得到显着进步,使机器人能够更好地理解复杂的语言命令并以增强的理解力和适应性执行高级任务,强调他们提高具体人工智能能力的潜力。然而,这一进步也带来了安全挑战,特别是在机器人导航任务中。安全管理不当会导致复杂环境下出现故障,并使系统容易受到恶意命令注入,从而产生绕道、碰撞等不安全行为。为了解决这些问题,我们提出了 \textit{SafeEmbodAI},这是一个用于将移动机器人集成到具体人工智能系统中的安全框架。 \textit{SafeEmbodAI} 结合了安全提示、状态管理和安全验证机制,以保护和协助大语言模型通过多模式数据进行推理并验证响应。我们设计了一个指标来评估面向任务的探索,在模拟环境中的评估表明,我们的框架有效地减轻了恶意命令的威胁,并提高了各种环境设置中的性能,确保了嵌入式人工智能系统的安全。值得注意的是,在具有混合障碍的复杂环境中,我们的方法与攻击场景中的基线相比,表现出 267% 的显着性能提升,凸显了其在挑战性条件下的鲁棒性。
通过有限自动机对大型语言模型进行声明式集成和管理:在自动化、通信和伦理方面的应用
分类: 形式语言和自动机理论, 人工智能, 计算和语言, 新兴技术, 人机交互, 68T20, I.2.7; H.5.2; K.4.1; D.3.2
作者: Thierry Petit, Arnault Pachot, Claire Conan-Vrinat, Alexandre Dubarry
发布时间: 2024-09-02
链接: http://arxiv.org/abs/2409.13693v1
摘要: 本文介绍了一种创新架构,旨在以声明方式将大型语言模型 (LLM) 与共享历史记录相结合,并通过触发器来确定最适合给定任务的 LLM。我们的方法是通用的和声明性的,依赖于有限自动机的构造和事件管理系统。开发的工具旨在以最少的编程工作促进大语言模型的高效和复杂的集成,特别是但不仅限于将积极心理学方法与人工智能集成。我们的技术的灵活性通过自动化、通信和道德领域的应用示例得到了证明。
DTRAN:使用数字孪生进行 RAN 优化的特殊用例
分类: 网络和互联网架构, 新兴技术
作者: Caglar Tunc, Kubra Duran, Buse Bilgin, Gokhan Kalem, Berk Canberk
发布时间: 2024-09-02
链接: http://arxiv.org/abs/2409.01136v1
摘要: 超 5G (B5G) 和 6G 网络的出现凸显了网络数字孪生 (DT) 等先进计算机辅助工具在促进自主网络和无处不在的智能方面的关键作用。 DT领域现有的解决方案主要旨在对网络生命周期内的特定任务进行建模和自动化,缺乏完全自主设计和管理的灵活性和适应性。与现有的 DT 方法不同,我们提出使用数字孪生 (DTRAN) 框架进行 RAN 优化,该框架遵循从核心到边缘网络的整体方法。所提出的 DTRAN 框架能够实现实时数据管理以及与物理网络的通信,这提供了比现有方法更准确和详细的数字副本。我们概述了 DTRAN 的主要构建模块,并描述了我们的具体用例(即 RAN 配置优化)的详细信息,以证明所提出的框架对于实际场景的适用性。
数字孪生网络的双时间尺度同步和迁移:一种多智能体深度强化学习方法
分类: 新兴技术, 人工智能, 网络和互联网架构, C.2.3; C.2.4
作者: Wenshuai Liu, Yaru Fu, Yongna Guo, Fu Lee Wang, Wen Sun, Yan Zhang
发布时间: 2024-09-02
链接: http://arxiv.org/abs/2409.01092v1
摘要: 数字孪生 (DT) 已成为表示物理世界的实时状态和实现自我维持系统的有前途的推动者。在实践中,为了减少延迟,物理设备(例如移动用户(MU))的DT通常部署在多接入边缘计算(MEC)网络中。为了确保 DT 的准确性和保真度,MU 必须定期将其状态与其 DT 同步。然而,MU 移动性给 DT 同步带来了重大挑战。首先,MU移动性会触发DT迁移,从而导致同步失败。其次,MU需要与其DT频繁同步以确保DT保真度。尽管如此,由MU移动性引起的MEC服务器之间的DT迁移可能很少发生。因此,我们提出了一种考虑可靠性的两时间尺度DT同步和迁移框架,通过建立非凸随机问题来最小化MU的长期平均能耗。我们使用李亚普诺夫理论来转换可靠性约束并将新问题重新表述为部分可观察马尔可夫决策过程(POMDP)。此外,我们开发了一种异构代理近端策略优化与 Beta 分布(Beta-HAPPO)方法来解决它。数值结果表明,与其他基准相比,我们提出的 Beta-HAPPO 方法在节能方面取得了显着改进。
具有三元权重的光学神经网络的退火启发训练
分类: 新兴技术
作者: Anas Skalli, Mirko Goldmann, Nasibeh Haghighi, Stephan Reitzenstein, James A. Lott, Daniel Brunner
发布时间: 2024-09-02
链接: http://arxiv.org/abs/2409.01042v1
摘要: 人工神经网络 (ANN) 代表了一种根本上的连接主义和分布式计算方法,因此它们不同于利用冯·诺依曼架构的经典计算机。这重新激发了人们对新的非常规硬件的研究兴趣,以更有效地实现人工神经网络,而不是在传统机器上进行模拟。为了充分利用新一代人工神经网络的功能,需要考虑硬件限制和缺陷的优化算法。光子学代表了一个特别有前途的平台,提供可扩展性、高速、能源效率和并行信息处理能力。然而,具有原位学习功能的自主光学神经网络(ONN)的成熟实现仍然很少。在这项工作中,我们提出了一种基于三元权重架构的高维半导体激光器ONN。我们介绍了一种利用布尔硬件实现三元权重的简单方法,显着提高了 ONN 的信息处理能力。此外,我们设计了一种新颖的原位优化算法,该算法与布尔权重和三元权重兼容,并针对两种不同的任务提供了该算法的详细超参数研究。我们的新颖算法在收敛速度和性能方面都带来了好处。最后,我们通过实验表征了 ONN 的长期推理稳定性,发现它非常稳定,在 10 多个小时的时间内一致性高于 99%,解决了该领域的主要问题之一。我们的工作在硬件资源有限的情况下进行原位学习特别重要,特别是因为最大限度地减少辅助硬件的功耗对于保持非冯诺依曼人工神经网络实现所实现的效率增益至关重要。
全面分析原子级精密制造的未来
分类: 新兴技术, 材料科学, 应用物理, 物理与社会
作者: Vadym Shvydun, Justin Sato, Gabriel Bristot
发布时间: 2024-09-02
链接: http://arxiv.org/abs/2409.00955v1
摘要: 原子精密制造(APM)是指以原子精度组装材料,代表着一种具有巨大潜力的高度先进技术。然而,APM的发展仍处于早期阶段,应用主要局限于专业领域,缺乏统一学科的凝聚力。当前有关 APM 的文献通常以较旧的推测性论文为主,这些论文讨论了其巨大的潜在风险和收益,但没有充分考虑最新进展或当今存在的实际限制。本文旨在通过对当前 APM 和准 APM 技术进行全面评估,并利用进一步进展的障碍来预测未来的发展,从而弥补这一差距。通过这种分析,我们试图更清楚地了解该技术的现状,然后利用这些见解来预测 APM 的未来轨迹。通过这样做,我们的目标是就 APM 及其潜在风险和收益进行更扎实的讨论,同时指导未来对该新兴领域的必要法规和安全考虑因素的研究。
渗透天空:地球观测星座中的数据延迟和溢出攻击
分类: 网络和互联网架构, 密码学和安全, 新兴技术
作者: Xiaojian Wang, Ruozhou Yu, Dejun Yang, Guoliang Xue
发布时间: 2024-09-02
链接: http://arxiv.org/abs/2409.00897v1
摘要: 低地球轨道 (LEO) 地球观测 (EO) 卫星改变了我们监测地球的方式。 EO 卫星就像移动的摄像机一样,组成具有不同任务和优先级的星座,捕获需要传输到地面进行处理的大量数据。然而,EO卫星的下行通信能力非常有限,受到传输带宽、地面站数量和位置以及卫星高速运动导致的小传输窗口的限制。为了优化资源利用,EO星座预计将共享通信频谱和地面站,以实现最大的通信效率。在本文中,我们研究了 EO 星座资源竞争暴露的新攻击面,针对使用合法 EO 服务的地球监测数据的延迟或丢失。具体来说,攻击者可以注入高优先级请求来暂时抢占低优先级数据传输窗口。此外,我们表明,通过利用可预测的卫星动态,攻击者可以智能地瞄准来自低优先级卫星的关键数据,要么延迟其传输,要么不可逆转地丢弃数据。我们制定了数据延迟攻击和数据溢出攻击两种攻击,设计算法来协助攻击者制定攻击策略,并分析其在典型场景中的可行性或最优性。然后,我们使用真实世界的卫星图像和轨道数据进行跟踪驱动的模拟,以评估在真实的卫星通信设置下发起这些攻击的成功概率。我们还讨论了针对这些攻击的可能防御措施。
具有直接反馈对准的大型 Transformer 和深度神经网络的光学训练
分类: 新兴技术, 无序系统和神经网络, 机器学习, 应用物理, 光学
作者: Ziao Wang, Kilian Müller, Matthew Filipovich, Julien Launay, Ruben Ohana, Gustave Pariente, Safa Mokaadi, Charles Brossollet, Fabien Moreau, Alessandro Cappelli, Iacopo Poli, Igor Carron, Laurent Daudet, Florent Krzakala, Sylvain Gigan
发布时间: 2024-09-01
链接: http://arxiv.org/abs/2409.12965v1
摘要: 现代机器学习几乎完全依赖于专用的电子硬件加速器。光子方法具有低功耗和高运算速度的特点,越来越多地被考虑用于推理,但迄今为止,仍然主要局限于相对基本的任务。同时,训练深度且复杂的神经网络的问题,绝大多数是通过反向传播来执行的,仍然是对当前架构的规模和性能的重大限制,也是主要的计算和能源瓶颈。在这里,我们在混合电子光子平台上实验性地实现了一种多功能且可扩展的训练算法,称为直接反馈对齐。光学处理单元执行大规模随机矩阵乘法,这是该算法的核心运算,速度高达 1500 TeraOps。我们对最新的深度学习架构之一(包括具有超过 1B 个参数的 Transformer)进行光学训练,并在语言和视觉任务上获得了良好的性能。我们研究了混合光学方法的计算扩展,并展示了超深和超宽神经网络的潜在优势,从而开辟了一条有希望的途径,以维持现代人工智能超越传统冯诺依曼方法的指数增长。
AirCompSim:用于空气计算的离散事件模拟器
分类: 网络和互联网架构, 新兴技术
作者: Baris Yamansavascilar, Atay Ozgovde, Cem Ersoy
发布时间: 2024-09-01
链接: http://arxiv.org/abs/2409.00689v1
摘要: 由于地面基础设施的固定容量无法满足用户的动态负载,无人机、飞机、气球、卫星等空中部件得到了广泛的应用。然而,由于应该协调这些空中组件以实现所需的服务质量,因此已经定义了包括空中计算在内的几种下一代范例。然而,尽管空中计算存在许多研究和开放研究问题,但测试环境有限,无法满足动态环境的性能评估要求。因此,在本研究中,我们介绍了我们的离散事件模拟器 AirCompSim,它通过其模块化结构实现了考虑动态变化的需求、负载和容量的空中计算环境。为了展示其功能,我们使用动态容量增强场景来研究用户数量、无人机数量以及不同应用类型的需求对平均任务成功率、服务时间和服务器利用率的影响。结果表明AirCompSim可以用于空气计算实验。
超压缩:通过超功能进行模型压缩
分类: 机器学习, 人工智能, 新兴技术
作者: Fenglei Fan, Juntong Fan, Dayang Wang, Jingbo Zhang, Zelin Dong, Shijun Zhang, Ge Wang, Tieyong Zeng
发布时间: 2024-09-01
链接: http://arxiv.org/abs/2409.00592v1
摘要: 大型模型尺寸的快速增长远远超过了GPU内存的增长。为了弥合这一差距,受到基因型和表型之间简洁关系的启发,我们将模型压缩问题转化为参数表示问题,提出所谓的超压缩。超压缩使用超函数来表示目标网络的参数,值得注意的是,这里的超函数是根据与一个问题相关的遍历理论设计的:低维动态系统最终是否可以填充高维空间。根据经验,所提出的超压缩具有以下优点: 1)\textbf{P}可参考的压缩比; 2) \textbf{N}o 事后再训练; 3) \textbf{A}可承受的推理时间; 4)\textbf{S}压缩时间短。它在一小时内压缩 LLaMA2-7B,并实现接近 int4 量化的性能,无需重新训练,性能下降小于 1%。我们的工作有可能振兴模型压缩领域,实现缩放定律和硬件升级停滞之间的和谐。